レビュー

完全無料で誰でも簡単に感情豊かな音声合成ができる「AivisSpeech」レビュー


JPChainが開発・運営する音声合成AIプロジェクト「Aivis Project」で提供される「AivisSpeech」は、無料で誰でも簡単に使える音声合成ソフトウェアです。人間の声と区別できないほどに感情豊かで高音質&高品質な音声を合成でき、個人・法人・商用を問わず、基本的にクレジット不要で自由に使うことができるとのことで、実際に使ってみました。

Aivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか?
https://aivis-project.com/


Aivis Projectの公式サイトにアクセスし、「AivisSpeechをダウンロード」をクリック。


今回はWindowsのインストーラー版をダウンロードします。インストーラーはEXE形式で、ファイルサイズは1.25MBでした。


ダウンロードしたインストーラーを実行すると、セットアップウィザードが起動します。「次へ」をクリック。


「次へ」をクリックします。


インストール先を選びます。「次へ」をクリック。


「インストール」をクリックします。


インストールが終わったら「完了」をクリック。


AivisSpeechが起動しました。音声合成エンジンの起動に30秒ほどかかります。


ライセンス情報が表示されるので、右上の「同意してはじめる」をクリック。


プライバシーポリシーが表示され、データ収集への協力をうながされます。今回は「許可」を選択しました。


AivisSpeechの画面はこんな感じ。入力欄をクリック。


すると、以下のようなUIが表示されました。このまま入力欄に、読み上げてほしいテキストを入力すればOK。


今回は夏目漱石の『吾輩は猫である』の冒頭部分を貼り付けてみました。複数の文章で構成されたテキストでしたが、句点に応じてセリフが分けられています。


テキストを読み込ませてそのまま読み上げてもらったところが以下のムービー。アクセントや音の高低などの調整を一切していませんが、違和感はほとんどなくスムーズに読めていることがわかります。発話は滑らかで、アクセントにも不自然な部分はほとんどありません。

誰でも簡単に感情豊かな音声合成ができる「AivisSpeech」に「我輩は猫である」を読み上げてもらった - YouTube


右側には音声の話速、スタイルの強さ、テンポの緩急、音高、音量、開始時と終了時の無音の長さを調整できるスライドがありました。


また、読み上げてもらっている音声モデルによっては複数の感情が用意されており、セリフ横にあるアイコンをクリックすることで、複雑な設定をしなくても音声ごとに感情を設定することが可能。


画面下部では、音声の日本語読みとアクセントを編集できます。


合成した音声は、「ファイル」にある「音声書き出し」を選択するとWAVE形式で書き出すことができます。


「音声書き出し」だと、セリフ毎に個別の音声ファイルとして書き出されます。


すべてのセリフを順番につなげた音声ファイルが欲しい場合は、「音声をつなげて書き出し」を選択します。


『我輩は猫である』の冒頭を一気に読んでもらった音声が保存されました。


読み上げる音声モデルを変更するには、「設定」から「話者リスト」を選択。


Aivis Projectは、学習済みモデル・ハイパーパラメータ・スタイルベクトル・話者メタデータを1つのファイルにまとめたAI音声合成モデル用オープンファイルフォーマットとして、AIVM(Aivis Voice Model)/AIVMX形式を提案しており、AivisSpeechではこのAIVM形式のモデルをインストールすることが可能です。AivisSpeechにはデフォルトで、音声合成モデルとして「Anneli」がインストールされており、その他の音声モデルを探すには「音声合成モデル」をクリックします。


ブラウザが開き、AIVM形式の音声合成モデルの一覧が表示されました。今回は「ろてじん(長老ボイス)」をインストールしてみます。


右側の「ダウンロード」をクリックすると、音声合成モデルがAIVM形式(ファイルサイズ:252.93MB)でダウンロードできます。


AivisSpeechのウィンドウに戻り、右上の「インストール/更新」をクリック。


「ファイルからインストール」を選択し、その下の入力欄でダウンロードした音声合成モデルを選択したら、「インストール/更新」をクリックします。


インストールが完了したら「閉じる」をクリック。


音声左に表示されているアイコンをクリックすると、話者を「ろてじん(長老ボイス)」に変更できました。


実際にAnneliとろてじんに『我輩は猫である』を交互に読んでもらったところが以下のムービー。

音声合成ソフト「AivisSpeech」で美少女と長老に『我輩は猫である』を交互に読み上げてもらったところ - YouTube


実際にAivisSpeechを使ってみると、完全無料でありながら商業ソフトウェアと比較しても遜色ない印象で、合成された音声のクオリティはかなり高いと感じました。UIは非常にシンプルで使いやすく、音声合成ソフトを使ったことがない人でも簡単に使うことができます。

なお、AIVM形式はオープンファイルフォーマットとのことで、記事作成時点でAivis ProjectはAIVM形式の音声合成モデルを制作できる無料ツールである「AivisBuilder」を開発中だとのこと。また、ブラウザ上でAIVMファイルを簡単に作成・編集できるAIVM Generatorも公開されています。

この記事のタイトルとURLをコピーする

・関連記事
たった数秒の音声データから音声合成が可能な「VoiceCraft」 - GIGAZINE

誰でも簡単に琴葉茜や結月ゆかりの自然な読み上げ音声を生成できる「A.I.VOICE2」レビュー - GIGAZINE

7種類の声でAIが文章を感情を込めて読み上げてくれる商用利用可能な読み上げソフト「VOICEPEAK」レビュー - GIGAZINE

テキストを入れるだけで簡単に自然なナレーションを作成してくれる音声合成ソフト「VOICEPEAK フリモメン」レビュー - GIGAZINE

マイクで録音するだけで誰でも「結月ゆかり」や「琴葉 茜・葵」の声になれるAI音声合成ソフト「Seiren Voice」を使ってみた - GIGAZINE

無料で文章から自動で読み上げ音声を合成してくれるソフト「VOICEVOX」を使ってみた - GIGAZINE

in レビュー,   ソフトウェア,   動画, Posted by log1i_yk

You can read the machine translated English article here.