AIでリアルタイムに高精度かつ自然なボイチェンができる「Voidol3R」用のRVC変換モデル「Megpoid」「音街ウナ」を使ってみた
クリムゾンテクノロジーの音質変換ソフト「Voidol3R」に搭載されているリアルタイム音質変換(RVC)モード用ボイスモデルに、「Megpoid」「音街ウナ」が2024年12月6日(金)に登場しました。リアルタイムのボイスチェンジャーでありながら、高精度かつ自然な声質変換を可能とのことで、実際に試してみました。
Voidol3R | 変幻自在の声質変換 | クリムゾンテクノロジー株式会社
https://crimsontech.jp/apps/voidol3r/
Voidol3RはVoidol 3から無償アップデートすることで、RVCエンジンである「Voidol RVC」に対応します。Voidol3Rのインストールと操作方法については、以下の記事を読むとよくわかります。
誰の声でも簡単・リアルタイムで女声・男声・ささやき声などへ自由自在に変換できる「Voidol3」のSYNTHモードを使ってみたよレビュー - GIGAZINE
Voidol3R本体をインストール後、Voidol RVCをインストールします。購入してダウンロードしたZIPファイルの中にあるVoidolRVCSetup.exeを起動すると、セットアップウィザードが起動します。利用規約が表示されるので、目を通したら「使用許諾契約書に同意します」にチェックを入れ、「インストール」をクリック。
インストールが終わったら「完了」をクリック。
Voidol3Rを起動して、メニューバーの「ツール」から「Voidol RVCを起動」を選択します。
Voidol RVCの画面はこんな感じ。ボイスモデルとそのアイコンが表示され、ピッチとノイズゲートを調整できるスライドバー、変換モード、オーディオ設定、ミュートとバイパスのオン・オフボタンが表示されています。
モデルを追加するには、「ファイル」から「ボイス変換モデルを追加する」を選択。
追加するモデルのCKPTファイルとライセンスキーを入力し、「追加」をクリックします。
すると、ボイス変換モデルが追加されました。あとはこのままインプットデバイスのマイクにしゃべりかければ、アウトプットデバイスから変換後の音声が出力される仕組み。
実際にVoidol RVCと「Megpoid」のボイス変換モデルでリアルタイムに声質変換をしてみたところが以下のムービー。変換元が男性の声なので、ピッチを+12に設定しています。変換モードによって声質変換のラグが変わり、「高速重視」であれば約0.5秒、「バランス」であれば約1秒、「品質重視」であれば約1.7秒の遅延があります。ただし、品質重視の方がわずかに変換後の声がなめらかに聞こえる印象。
リアルタイムボイスチェンジャー「Voidol RVC」でMegpoidの声にボイチェンしてみた - YouTube
今度は音街ウナのボイス変換モデルを読み込んでみました。
以下のムービーで、ピッチを+12に設定して男性編集部員の声を音街ウナの声に変換してみたところを確認できます。ラグはMegpoidと同じで、変換モードを「バランス」にすると約1秒、「高速変換」にするとラグが約0.5秒、「品質重視」にすると約1.7秒となりました。ムービーを見ると分かる通り、元の声質と変換後の声質はかなり異なりますが、何をしゃべっているのかがちゃんと聞き取れる程度にはクリアに変換されていることがわかります。
Voidol RVCのボイス変換モデル「音街ウナ」でリアルタイムに声質変換してみた - YouTube
Voidol RVCのアウトプットデバイスに「スピーカー(Voidol 音声)(MME)」を指定し、Discordなどのボイスチャットの入力デバイスに「スピーカー(Voidol 音声)」を指定すれば、ボイスチャット上でリアルタイムに声質変換をしながら会話をすることが可能です。
なお、Voidol3Rはグラフィックボード非搭載のPCまたはMacでも利用できますが、RVCモードはNVIDIA製グラフィックボードを搭載したWindows PCでのみ利用可能となっているので注意が必要。推奨スペックは「CPU:Intel Core i7-9750H以上」「GPU:GeForce GTX 1650 4GB GDDR5以上」「メモリ:16GB以上」「空きストレージ:10GB以上」です。
Voidol3RはAmazon.co.jpで、税込2万9700円で購入可能。2025年1月7日(火)までは10%オフの2万6730円で購入できます。
Amazon.co.jp: Voidol3R for Windows Voidolシリーズウィンターセール2024|ダウンロード版 : 楽器・音響機器
Voidol RVCモード用ボイスモデルのMegpoidと音街ウナは税込4400円で購入可能。2025年1月7日(火)までは、以下のページから20%オフの税込3520円でダウンロード購入できます。
Amazon.co.jp: Megpoid(メグッポイド)Voidol RVCモード用ボイスモデル Voidolシリーズウィンターセール2024|ダウンロード版 : 楽器・音響機器
Amazon.co.jp: 音街ウナ Voidol RVCモード用ボイスモデル Voidolシリーズウィンターセール2024|ダウンロード版 : 楽器・音響機器
・関連記事
AIを使って美少女の声からイケボまで変幻自在&直感的に変換できるリアルタイムボイスチェンジャー「Voidol3」のAIモードを使ってみた - GIGAZINE
誰の声でも簡単・リアルタイムで女声・男声・ささやき声などへ自由自在に変換できる「Voidol3」のSYNTHモードを使ってみたよレビュー - GIGAZINE
無料&音声をリアルタイムで変換できるAIボイスチェンジャー「Koemake RVC Player」レビュー - GIGAZINE
無料で自分の声を違うキャラクターなどの声にできるリアルタイム音声変換AIを簡単に使えるボイスチェンジャークライアント「VC Client」でどれぐらい声が変わるかレビュー - GIGAZINE
無料でブラウザから簡単に声を10種類に変換できるボイスチェンジャー「Koe Recast」を使ってみた - GIGAZINE
・関連コンテンツ
in レビュー, ソフトウェア, 動画, Posted by log1i_yk
You can read the machine translated English article I tried using the RVC conversion models ….