010_共通

共通

本アプリケーションを使用する際の前提や共通する操作

本アプリケーションのトレーニングアプリとボイスチェンジャーはDockerを前提としています。下記の環境での動作を目標としていますが、Dockerが動く環境であればこれら以外でも動くかもしれません。目標とする環境での動作テストは一部未完です。徐々に進めていきますが、皆様からのご報告もありがたいです。

なお、音声録音アプリはGithub Pages上で動いているため、ブラウザのみが前提となります(Dockerは不要です)。

また、トレーニングとボイスチェンジャーはDockerでの使用を推奨していますが、Github pagesやGoogle Colablratoryでも動くようになっています。

Linux + Docker: (debian11で動作確認済み)
Windows(WSL2) + Docker: (wsl2 + ubuntu20.04 LTSで動作確認済み)
Colab:
- ノートへのリンク: 事前設定内でColabから実行できます。Colabの制約により自動切断が行われるリスクがあるためDockerでの使用を強く推奨します。

Linux + Docker: (debian11で動作確認済み)
Windows(WSL2) + Docker: (wsl2 + ubuntu20.04 LTSで動作確認済み)
MacOS: 未
Colab:
- 簡単バージョン: 事前設定なしでColabから実行できます。
- 詳細バージョン: Google Driveと連携してモデルを読み込むことができます。

また、GUI（ブラウザ）はChromeのみサポートします。

各環境へのDockerのインストール方法については説明しません。下記に示すリンク先などを参考にご準備ください。

Linux上でGPUを用いたDockerの環境構築
- Nvidiaの公式。非常にシンプルでわかりやすいです。
- GPUを認識させる手順の中で素のGPUを使用しないDockerの環境も構築します。GPUを使用しない場合もこちらを参考にすればOKだと思います。
WSL上でGPUを用いたDockerの環境構築
- 少し難易度高いですが、一応この記事が一番参考になると思います。
- （Windowsだと手元で構築手順を再現するのが難しいので、今も記載内容のままで環境構築できるかは試していません。皆様のご武運をお祈りします。）
MacOS: 未

Docker on WSL2の挙動については、本ソフトウェアの責任範囲外となりますが、一部有識者でないと回避できないと思われる部分があります。その内容について注釈として記載しますが、挙動の変更等に伴い記載内容に齟齬が出る可能性があります。詳細は公式サポートへお問い合わせください。

(1) Docker の起動 WSL2上でDockerを起動する場合には次のコマンドを実行する必要があります。

sudo service docker start

(2) 一般ユーザでのDockerの操作 VC Trainer and Playerは一般ユーザで起動する必要があります。次のコマンドを実行して、再ログインしてください。

sudo usermod -aG docker zundamon

アプリケーションのリポジトリをクローンします。なお、音声録音アプリのみを使用する場合は、スキップしても構いません。

git clone --depth 1 https://github.com/w-okada/voice-changer.git

以上です。お疲れさまでした。

音声録音アプリを使用する場合は、「音声録音」のページへ移動してください。

MMVCのモデルをトレーニングする場合は、「トレーニング」のページへ移動してください。

ボイスチェンジャを使用する場合は、「ボイスチェンジャ」のページへ移動してください。