AI

音楽生成AI「Stable Audio 3.0」が登場、6分以上の音楽を生成可能な大型モデルとスマホで動作する小型モデルが公開される


画像生成AI「Stable Diffusion」の開発元として知られるAI企業のStability AIが音楽生成AI「Stable Audio 3.0」を公開しました。

Stable Audio 3.0 | Generative Audio Models — Stability AI
https://stability.ai/stable-audio

Stable Audio 3.0, the model family built with open-weight models
— Stability AI

https://stability.ai/news-updates/meet-stable-audio-3-the-model-family-built-for-artistic-experimentation-with-open-weight-models

Stable Audio 3.0は「Stable Audio 3.0 Small」「Stable Audio 3.0 Small SFX」「Stable Audio 3.0 Medium」「Stable Audio 3.0 Large」の4種類に分かれてリリースされており、「Stable Audio 3.0 Small」「Stable Audio 3.0 Small SFX」「Stable Audio 3.0 Medium」の3種がオープンモデルとして無料公開されています。各モデルの特徴は以下の通り。

Stable Audio 3.0 Small:最大2分の音楽を生成可能。スマートフォンやノートPCでも動作する小型モデル。ショートトラックの生成に最適。
Stable Audio 3.0 Small SFX:最大2分の音楽を生成可能。スマートフォンやノートPCでも動作する小型モデル。サウンドエフェクトなどの生成に最適。
Stable Audio 3.0 Medium:最大6分20秒の音楽を生成可能。高度な音楽表現が可能
Stable Audio 3.0 Large:最大6分20秒の音楽を生成可能。シリーズの中で最高性能のモデル


Stable Audio 3.0は「既存の楽曲の編集」や「既存の楽曲の続きを生成」といった操作にも対応。LoRAを用いて好みのテイストに調整することもできます。

「Stable Audio 3.0 Small」「Stable Audio 3.0 Small SFX」「Stable Audio 3.0 Medium」は以下のリンク先で配布されています。

stabilityai/stable-audio-3-small-music · Hugging Face
https://huggingface.co/stabilityai/stable-audio-3-small-music

stabilityai/stable-audio-3-small-sfx · Hugging Face
https://huggingface.co/stabilityai/stable-audio-3-small-sfx

stabilityai/stable-audio-3-medium · Hugging Face
https://huggingface.co/stabilityai/stable-audio-3-medium

また、生成AIツールの「ComfyUI」がStable Audio 3.0での音楽生成に即日対応しています。


Stable Audio 3.0 LargeはStability AIのAPIを介して利用可能なほか、企業向けのモデル提供も行われています。

この記事のタイトルとURLをコピーする

・関連記事
Googleが音楽生成AI「Lyria 3」を公開したので日本語ボーカル付き楽曲を作ってみた - GIGAZINE

好きな声で好きなセリフを喋らせられるローカルAI「Irodori-TTS」の使い方、日本語特化でローカル動作するので無制限に生成し放題 - GIGAZINE

高品質な歌唱付き楽曲を爆速生成できる音楽生成AI「ACE-Step 1.5」が登場、VRAM容量4GB未満のPCでローカル実行可能でLoRAにも対応 - GIGAZINE

歌詞から曲を作れる無料の音楽生成AIモデル「YuE」、日本語にも対応し複数の言語が混ざる楽曲も生成可能 - GIGAZINE

in AI, Posted by log1o_hf

You can read the machine translated English article Music generation AI 'Stable Audio 3.0' u….