Skip to content

010_共通

Wataru Okada edited this page Dec 7, 2022 · 29 revisions

共通

本アプリケーションを使用する際の前提や共通する操作

前提

本アプリケーションのトレーニングアプリとボイスチェンジャーはDockerを前提としています。下記の環境での動作を目標としていますが、Dockerが動く環境であればこれら以外でも動くかもしれません。目標とする環境での動作テストは一部未完です。徐々に進めていきますが、皆様からのご報告もありがたいです。

なお、音声録音アプリはGithub Pages上で動いているため、ブラウザのみが前提となります(Dockerは不要です)。

また、トレーニングとボイスチェンジャーはDockerでの使用を推奨していますが、Github pagesやGoogle Colablratoryでも動くようになっています。

  1. 音声録音アプリ
  1. トレーニングアプリ
  • Linux + Docker: (debian11で動作確認済み)
  • Windows(WSL2) + Docker: (wsl2 + ubuntu20.04 LTSで動作確認済み)
  • Colab:
    • ノートへのリンク: 事前設定内でColabから実行できます。Colabの制約により自動切断が行われるリスクがあるためDockerでの使用を強く推奨します。
  1. ボイスチェンジャー
  • Linux + Docker: (debian11で動作確認済み)
  • Windows(WSL2) + Docker: (wsl2 + ubuntu20.04 LTSで動作確認済み)
  • MacOS: 未
  • Colab:

また、GUI(ブラウザ)はChromeのみサポートします。

Dockerインストール

各環境へのDockerのインストール方法については説明しません。下記に示すリンク先などを参考にご準備ください。

  • Linux上でGPUを用いたDockerの環境構築
    • Nvidiaの公式。非常にシンプルでわかりやすいです。
    • GPUを認識させる手順の中で素のGPUを使用しないDockerの環境も構築します。GPUを使用しない場合もこちらを参考にすればOKだと思います。
  • WSL上でGPUを用いたDockerの環境構築
    • 少し難易度高いですが、一応この記事が一番参考になると思います。
    • (Windowsだと手元で構築手順を再現するのが難しいので、今も記載内容のままで環境構築できるかは試していません。皆様のご武運をお祈りします。)
  • MacOS: 未

Docker on WSL2ユーザへの注釈

Docker on WSL2の挙動については、本ソフトウェアの責任範囲外となりますが、一部有識者でないと回避できないと思われる部分があります。その内容について注釈として記載しますが、挙動の変更等に伴い記載内容に齟齬が出る可能性があります。詳細は公式サポートへお問い合わせください。

(1) Docker の起動 WSL2上でDockerを起動する場合には次のコマンドを実行する必要があります。

sudo service docker start

(2) 一般ユーザでのDockerの操作 VC Trainer and Playerは一般ユーザで起動する必要があります。次のコマンドを実行して、再ログインしてください。

sudo usermod -aG docker zundamon

リポジトリのクローン

アプリケーションのリポジトリをクローンします。なお、音声録音アプリのみを使用する場合は、スキップしても構いません。

git clone --depth 1 https://github.com/w-okada/voice-changer.git

さいごに

以上です。お疲れさまでした。

音声録音アプリを使用する場合は、「音声録音」のページへ移動してください。

MMVCのモデルをトレーニングする場合は、「トレーニング」のページへ移動してください。

ボイスチェンジャを使用する場合は、「ボイスチェンジャ」のページへ移動してください。

Clone this wiki locally