テキスト入力をAIが感情豊かな音声に変換してくれる「DMMボイス」が「にじボイス」に生まれ変わったので使ってみた
2024年11月1日、テキストを入力すると迫真の演技でAIが読み上げてくれるという音声生成サービス「DMMボイス」のクローズドベータ版がリリースされました。このDMMボイスはクローズドベータでのリリースであったにもかかわらず多くの注目を集めたため、公開からわずか1週間でサービスを一時停止せざるを得ない状況に陥っていました。そんなDMMボイスが「にじボイス」に生まれ変わり、11月20日に再リリースされたので、実際どんな音声が作れるのか触って確かめてみました。
にじボイス | AIによる感情豊かな音声生成サービス
https://nijivoice.com/
にじボイスを使うには、トップページにある「無料で始める」をクリック。にじボイスは記事作成時点ではアカウントを作成したり、ログインしたりすることなく無料で利用可能です。
使い方は簡単で、キャラクターを選択し、画面右端にあるテキストボックスに生成したい文章を入力し、「生成&再生」をクリックするだけ。なお、DMMボイスからにじボイスに生まれ変わったことで、選択可能なキャラクター数が20体から35体に増加、音声に変換できる文字数制限も70文字から140文字に拡大しています。
「生成&再生」をクリックしてから下部にある黒色のダウンロードボタンをクリックすると、生成した音声をダウンロード可能。なお、音声ファイルはWAV形式で出力されます。
にじボイスで利用できる35体のキャラクターに「ギガジン」としゃべらせてみた動画が以下。個性的な声のキャラクターがたくさんいることがよくわかるはず。
テキスト入力をAIが感情豊かな音声に変換してくれる「にじボイス」レビュー - YouTube
実際に使ってみると、長めの文章だとかなり早口でまくしたてるような音声出力になってしまうケースがありました。そんな時は、句読点や感嘆符・疑問符などを入れることで、よりリアルな抑揚のある語り口調に変換できるので試行錯誤してみてください。
にじボイスを開発するAlgomatic Globalの原田CEOはサービス名を改名した理由として「僕らのカンパニー名はAlgomatic Globalという名前なのですが『世界で勝負できる生成AIカンパニーを創る』という目標を掲げています。そのアプローチとして賭けている未来が日本発の声を使った世界的サービスを創ることです。DMMという看板は正直大きく認知にはつながりやすいのですが、これから僕らが目指すのはDMMさえも超える巨大な企業を創ることです。僕らはこれから『にじボイス』として自分たち独自のブランドで世界に勝負を仕掛けます」とブログで説明しています。
なお、にじボイスは2024年12月4日まで無料で利用可能ですが、12月4日に正式版がリリースされると有料化してしまうので、気になる人は早めに一度使ってみてください。
・関連記事
Googleが音声生成AIの現状を解説、わずか1秒で40秒分の会話音声を生成できるも人間からは「不気味に聞こえる」と評価 - GIGAZINE
たった数秒の音声データから音声合成が可能な「VoiceCraft」 - GIGAZINE
OpenAIがわずか15秒の音声からクローン音声を生成できるAIモデル「Voice Engine」をリリース - GIGAZINE
7種類の声でAIが文章を感情を込めて読み上げてくれる商用利用可能な読み上げソフト「VOICEPEAK」レビュー - GIGAZINE
Metaがテキストと音声の入出力を統合できる初のオープンソースマルチモーダル言語モデル「Spirit LM」をリリース - GIGAZINE
Microsoftがわずか数秒のサンプルから会話や歌声を再現できる音声合成AI「NaturalSpeech 2」を発表 - GIGAZINE
・関連コンテンツ