WindowsでオーディオファイルをWhisper文字起こしできるアプリ
Windows向けにサクッと音声ファイルをWhisper文字起こしできるアプリが無かったので作りました。 コードはChatGPTに書いてもらいました。 アプリはboothで無料版、有料版を配布してます。→ https://umiyuki.booth.pm/items/4663311
使用しているMediaToolkitと言うライブラリが内部でFFMpegを使ってて、FFMpegはGPLだかLGPLライセンスらしいので、とりあえずこのコードもGPLでオープンソースにしました。
プロジェクトはVisualStudio2019で作成しています。 C#でWindows Formアプリケーションです。
VisualStudio2019で普通にビルドできるハズです。アイコンファイルはIcon8というフリーアイコンサイトからダウンロードしたものなので、リポジトリには上げてません。 こちらからダウンロードしてicoファイルに変換してください。→ Create icon by Icons8
別途whisper-ctranslate2をPyInstallerでexeファイル作成してフォルダに入れる必要があります。 https://github.com/Softcatala/whisper-ctranslate2
また、モデルファイルや、cudnn、cuBLAS、zlibwapiのDLLもダウンロードしてwhisper-ctranslate2のexeファイルのあるフォルダに入れる必要があります。
アプリの使用方法はこちらの販売ページに書いてあるものを参考にしてください。→https://umiyuki.booth.pm/items/4663311
Whisper by OpenAI https://github.com/openai/whisper
CTranslate2 by guillaumekln https://github.com/OpenNMT/CTranslate2/
faster-whisper by guillaumekln https://github.com/guillaumekln/faster-whisper
whisper-ctranslate2 by jordimas https://github.com/Softcatala/whisper-ctranslate2