高品質な歌唱付き楽曲を爆速生成できる音楽生成AI「ACE-Step 1.5」が登場、VRAM容量4GB未満のPCでローカル実行可能でLoRAにも対応

音楽生成AI「ACE-Step 1.5」が2026年2月3日にオープンモデルとして公開されました。ACE-Step 1.5では歌唱付きの高品質な楽曲を高速生成可能。VRAM消費量は4GB未満なので、多くのグラフィックボード搭載PCで実行することができます。
ACE-Step 1.5: Pushing the Boundaries of Open-Source Music Generation
https://ace-step.github.io/ace-step-v1.5.github.io/
ACE-Step 1.5 is Now Available in ComfyUI
https://blog.comfy.org/p/ace-step-15-is-now-available-in-comfyui
We're releasing ACE-Step-v1.5(2B), a fast, high-quality open-source music model.
— ACE Music (@acemusicAI) February 3, 2026
It runs locally on a consumer-grade GPU, generates a full song in under 2 seconds(on an A100), supports LoRA fine-tuning, and beats SUNO on common eval metrics.
GitHub: https://t.co/Y2CQETtltB
Key… pic.twitter.com/68OA1QQrrD
ACE-Step 1.5は言語モデル(LM)とDiffusion Transformer(DiT)を組み合わせたハイブリッドアーキテクチャの音楽生成AIで、プロンプトに応じて歌唱付きの高品質な楽曲を生成できるほか、LoRAを用いて既存の曲に似た雰囲気の曲を作ることもできます。商用モデルを上回る品質で数秒のループ音源から10分間の楽曲まで生成可能で、NVIDIA A100なら1曲当たり2秒未満、GeForce RTX 3090でも1曲当たり10秒未満で生成が可能です。
公式ページではデモ音源も複数公開されていたので再生してみました。日本語の楽曲もローマ字表記で歌詞を入力すればある程度は生成可能なようです。
音楽生成AI「ACE-Step 1.5」のデモ音源たち - YouTube

ACE-Step 1.5をブラウザ上で実行できるデモアプリも公開されているので実際に使ってみました。
🎛️ ACE-Step V1.5 Playground💡
https://huggingface.co/spaces/ACE-Step/Ace-Step-v1.5

「Prompt」の欄に楽曲全体の説明、「Lyrics」の欄に歌詞を入力して「Generate Music」をクリック。

今回入力したプロンプトは以下。エレクトロニックなJ-POPを生成してみます。
An energetic, J-pop vocal performance over a driving electronic beat. The track is built on a foundation of punchy synth bass, crisp drum machine rhythms, and layered synthesizers. A powerful female vocal delivers catchy melodies in Japanese.
歌詞はこんな感じ
osusi daisuki. susi ga suki.
osoba daisuki. soba mo suki.
demo demo ichiban sukinanowa.
hamburger! hamburger! hamburger!
I like hamburger, my favorite food is hamburger!
完成した楽曲が以下。日本語は少し怪しいですが、英語の歌唱パートは完璧です。
音楽生成AI「ACE-Step 1.5」で日本語の楽曲を作ってみた - YouTube

ACE-Step 1.5のモデルデータは以下のリンク先で無料配布されています。ライセンスはMIT Licenseです。
ACE-Step/Ace-Step1.5 · Hugging Face
https://huggingface.co/ACE-Step/Ace-Step1.5
日本語のチュートリアルも用意されています。
ACE-Step 1.5 究極ガイド(必読) | ACE-Step-1.5/docs/ja/Tutorial.md at main · ace-step/ACE-Step-1.5 · GitHub
https://github.com/ace-step/ACE-Step-1.5/blob/main/docs/ja/Tutorial.md
またAI実行アプリのComfyUIでもすでにサポートされています。ComfyUI開発チームによると、4分の楽曲をGeForce RTX 3090で10秒以内、GeForce RTX 5090で1秒以内に生成できるそうです。
ACE-Step 1.5 just dropped in ComfyUI. Full songs in under 10 seconds. Less than 4GB VRAM. Open-source music generation just got serious. pic.twitter.com/nLYsx52dkq
— ComfyUI (@ComfyUI) February 3, 2026
・関連記事
リスナーの97%は音楽がAI作か人間作かを見破れないと調査で判明 - GIGAZINE
ワーナーが音楽生成AI「Suno」と和解して提携することを発表 - GIGAZINE
歌詞から曲を作れる無料の音楽生成AIモデル「YuE」、日本語にも対応し複数の言語が混ざる楽曲も生成可能 - GIGAZINE
2秒以内に商業レベルの高品質音楽を生成できる音楽生成AI「Stable Audio 2.5」 - GIGAZINE
スマホでローカル動作する音楽生成AI「Stable Audio Open Small」が公開される、最大11秒の音声を8秒未満で生成可能 - GIGAZINE
高品質なクラシック曲と楽譜を出力できる音楽生成AI「NotaGen」 - GIGAZINE
・関連コンテンツ
in AI, 動画, レビュー, Posted by log1o_hf
You can read the machine translated English article Introducing ACE-Step 1.5, a music genera….







