文章で指示するだけで音楽を作れる音楽生成AI「Stable Audio 2.0」が登場したので使ってみた
画像生成AI「Stable Diffusion」の開発元として知られるStability AIが音楽生成AI 「Stable Audio 2.0」を公開しました。すでに日本からも利用可能になっていたので、実際にStable Audio 2.0を使って音楽を生成する手順をまとめてみました。
Stable Audio 2.0 のご紹介 — Stability AI Japan
https://ja.stability.ai/blog/stable-audio-20
◆Stable Audio 2.0で作れる音楽の例
Stable Audio 2.0はテキストで指示するだけで音楽を生成できるAIです。以下のムービーを再生すると、「Cinematic Synthwave(映画風のシンセウェイヴ)」というプロンプトで生成した音楽の例を聴けます。
Stable Audio 2.0 - YouTube
◆Stable Audio 2.0のユーザー登録手順
Stable Audio 2.0を使うには、まず以下のリンクをクリックしてStable Audioのウェブアプリを開きます。
Stable Audio - Generative AI for music & sound fx
https://stableaudio.com/
ウェブアプリを開いたら、ユーザー登録するために画面右上の「Sign up」をクリック。
すると、ユーザー登録画面が表示されます。今回はGoogleアカウントを使ってユーザー登録を進めるので、「Continue with Google」をクリック。
Googleのログインページが表示されたらメールアドレスを入力して「次へ」をクリック。
パスワードを入力して「次へ」をクリック。
「次へ」をクリック。
これでユーザー登録が完了しました。続いて、画面左下の「Try now」をクリック。
規約をよく読んでから同意のチェックを入れて、「Next」をクリック。
これでStable Audio 2.0を使って音楽を生成する準備が整いました。
◆音楽を生成する手順
音楽を生成するには、画面左側のテキスト入力欄に生成したい音楽の説明文を入力し、生成する音楽の長さ(最大3分)を決めて「Generate」をクリックすればOK。今回は「rock music(ロックミュージック)」と入力しました。
「Generate」をクリックすると生成が始まるのでしばらく待ちます。今回は3分の音楽を約2分で生成できました。
再生ボタンをクリックすると生成した音楽を再生できます。
以下のムービーを再生すると、「rock music(ロックミュージック)」というプロンプトで生成した音楽を聴けます。
音楽生成AI「Stable Audio 2.0」で生成した音楽その1 - YouTube
Stable Audio 2.0では、生成した音楽を用いて「生成した音楽に似た音楽」を生成することもできます。似た音楽を生成するには「Use as input」をクリック。
すると、画面左側に音楽が追加されます。
音楽が追加されたら、新たに生成したい音楽の説明文を入力して「Generate」をクリック。今回は「Lo-Fi, rock(ローファイ、ロック)」と入力しました。
しばらく待つと、新たな音楽が生成されます。
「Lo-Fi, rock(ローファイ、ロック)」というプロンプトで生成した音楽が以下。元の音楽のリズムなどを残しつつ、雰囲気が変化しています。
音楽生成AI「Stable Audio 2.0」で生成した音楽その2 - YouTube
生成した音楽をダウンロードするには、赤枠で囲ったダウンロードボタンをクリックします。
すると、音楽のダウンロードメニューが表示されます。無料プランの場合、「MP3」か「Video」をクリックして音楽をダウンロードできます。
「Video」をクリックした場合、以下のようなMP4形式のムービーをダウンロードできます。
音楽生成AI「Stable Audio 2.0」で生成した音楽その3 - YouTube
◆有料プランもあり
Stable Audioは基本使用料無料で、無料プランの場合は音楽生成トークンが毎月20個もらえます。Stable Audio 2.0を用いた音楽生成では1曲当たり2トークンを消費するため、無料プランでは毎月10曲生成できるというわけです。
Stable Audioには有料プランも存在しており、一月ごとにもらえるトークンを増やすことが可能。それぞれのプランの月額料金や一月ごとにもらえるトークン数は以下の通りです。
プラン名 | 月額料金 | トークン |
---|---|---|
Free | 無料 | 20 |
Pro | 11.99ドル(約1820円) | 500 |
Studio | 29.99ドル(約4550円) | 1350 |
Max | 89.99ドル(約1万3650円) | 4500 |
・関連記事
サンプリングに使える素材をテキストプロンプトや音声ファイルを基に自動生成するAIサービス「Soundry AI」 - GIGAZINE
録音した音声を一発でプロっぽく仕上げてくれる「Enhance Speech from Adobe」を使ってみたレビュー - GIGAZINE
音声・テキスト・画像・音楽の入出力に対応したマルチモーダル大規模言語モデル(LLM)「AnyGPT」が登場 - GIGAZINE
Google DeepMindが音楽生成に特化したAIモデル「Lyria」を発表、口ずさむだけでメロディーが生成される - GIGAZINE
・関連コンテンツ