【現代の魔法】VG WebUIの使い方入門:RVC WebUI AIボイスチェンジャーの学習モデルでテキスト音声合成 -TTS with RVC AI Voice Changer Tutorial



【現代の魔法】VG WebUIの使い方入門:RVC WebUI AIボイスチェンジャーの学習モデルでテキスト音声合成 -TTS with RVC AI Voice Changer Tutorial

【現代の魔法】VG WebUIの使い方入門:RVC WebUI AIボイスチェンジャーの学習モデルでテキスト音声合成 -TTS with RVC AI Voice Changer Tutorial

【RVC WebUIの学習モデル活用術】AIボイチェン(AIボイスチェンジャー)ことRVC WebUIで作成した学習モデルを使って、日本語や英語のテキスト音声合成(テキストの音声読み上げ – TTS:Text-To-Speech )ができてしまう「VG WebUI」(Voice Generator WebUI)の使い方を動画で解説しました。
動画では女性の声(女声)から女性の声への変換や、男性の声(男声)から女性の声への変換などをしています。

パソコンの事情により、リアルタイムAIボイスチェンジャーのチュートリアル作成は諦めましたが、AIボイスチェンジャーに関心のある日本の方が、気軽にAIボイスチェンジャーで作成したオリジナルの学習モデルを活用してテキスト音声合成を試せるようにするために、GoogleアカウントがあればWindows・Macを問わずにウェブブラウザ上で無料で使えるGoogle Colaboratory(グーグルコラボレイトリー)で簡単に動かすことができる、使い方の解説付きのプログラムと解説記事を公開することにしました。
テキストの解説だけでは、VG WebUIの使い方がイメージしにくい場合などに、今回のチュートリアル動画を活用していただけますと幸いです。

How to Use VG WebUI App. (Text-To-Speech with RVC AI Voice Changer)
Free AI Voice Changer Tutorial for Machine Learning Python-PyTorch Programming: Male & Female(Girl) Voice(Japanese & English)

【動画の内容】
0:00 はじめに
2:06 VG WebUIの起動編
2:55 学習モデルの準備・作成
7:40 セットアップなど
8:30 VG WebUIの起動
8:57 VG WebUIの使い方編:サンプル音声モデルデータ
10:51 AIボイスチェンジャーでテキスト音声合成
12:49 英語のテキスト音声合成
13:25 最後に

【動画で紹介しているプログラム】
オリジナルのRVC WebUIのコード:
RVC-Project(旧liujing04)/Retrieval-based-Voice-Conversion-WebUI(The MIT License)| GitHub
https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI

RVC WebUIの使い方のサンプルコード(学習モデル作成用):
RVC-WebUI-for-Japanese-AI-beginners.ipynb(The MIT License)| Google Colaboratory
https://colab.research.google.com/drive/1MI6mh8hZY8hyF6VjW4gFgbxXmwTFMCEk?usp=sharing

動画で紹介しているRVC WebUIのチュートリアル:
【現代の魔法】RVC WebUIの使い方入門:オリジナルAIボイスチェンジャーを作ろう(男性・女性の声)RVC WebUI – AI Voice Changer Tutorial by RehabC – デジタルで、遊ぶ。
https://youtu.be/PHmePSSKD88

オリジナルのVG WebUIのコード:
log1stics/voice-generator-webui(The MIT License)| GitHub
https://github.com/log1stics/voice-generator-webui

VG WebUIの使い方のサンプルコード(テキスト音声合成用):
VG-WebUI-TTS-for-Japanese-AI-beginners.ipynb(The MIT License)| Google Colaboratory
https://colab.research.google.com/drive/1JRDUMK4AyXRyfailf6kM6MNOkquvSNlM?usp=sharing

【動画でテキスト音声合成している音声】
(日本語のテキスト音声合成)
数十年後にAIの歴史を振り返った時、2023年は音声AIの普及にとって、ターニングポイントとなった年だと認識されているだろう。

(英語のテキスト音声合成)
Decades from now, when we look back on the history of AI, the year 2023 will be recognized as a turning point for the spread of voice AI.

【追記:2023年4月27日】
2023年4月24日時点で、開発者の方が、日本語の音素とアクセントの変更方法についてのドキュメントを公開してくださっています。
ボイスチェンジした音声を出力後に、日本語の音素とアクセントを調整したい場合などに参考にしてみてください。

日本語の音素・アクセントに関して – og1stics/voice-generator-webui | GitHub
https://github.com/log1stics/voice-generator-webui/blob/main/docs/ja/accent.md

記事ページ:
VG WebUIの使い方:AIボイスチェンジャー(RVC WebUI)の学習モデルでテキスト音声合成入門 by 子供プログラマー
https://child-programmer.com/ai-voice-change-tts-tutorial/

#機械学習 #ボイスチェンジャー

Comments are closed.