2026年02月04日 11時23分レビュー

高品質な歌唱付き楽曲を爆速生成できる音楽生成AI「ACE-Step 1.5」が登場、VRAM容量4GB未満のPCでローカル実行可能でLoRAにも対応

音楽生成AI「ACE-Step 1.5」が2026年2月3日にオープンモデルとして公開されました。ACE-Step 1.5では歌唱付きの高品質な楽曲を高速生成可能。VRAM消費量は4GB未満なので、多くのグラフィックボード搭載PCで実行することができます。

ACE-Step 1.5: Pushing the Boundaries of Open-Source Music Generation
https://ace-step.github.io/ace-step-v1.5.github.io/

ACE-Step 1.5 is Now Available in ComfyUI
https://blog.comfy.org/p/ace-step-15-is-now-available-in-comfyui

We're releasing ACE-Step-v1.5(2B), a fast, high-quality open-source music model.

It runs locally on a consumer-grade GPU, generates a full song in under 2 seconds(on an A100), supports LoRA fine-tuning, and beats SUNO on common eval metrics.

GitHub: https://t.co/Y2CQETtltB

Key… pic.twitter.com/68OA1QQrrD
— ACE Music (@acemusicAI) February 3, 2026

ACE-Step 1.5は言語モデル(LM)とDiffusion Transformer(DiT)を組み合わせたハイブリッドアーキテクチャの音楽生成AIで、プロンプトに応じて歌唱付きの高品質な楽曲を生成できるほか、LoRAを用いて既存の曲に似た雰囲気の曲を作ることもできます。商用モデルを上回る品質で数秒のループ音源から10分間の楽曲まで生成可能で、NVIDIA A100なら1曲当たり2秒未満、GeForce RTX 3090でも1曲当たり10秒未満で生成が可能です。

公式ページではデモ音源も複数公開されていたので再生してみました。日本語の楽曲もローマ字表記で歌詞を入力すればある程度は生成可能なようです。

音楽生成AI「ACE-Step 1.5」のデモ音源たち - YouTube

ACE-Step 1.5をブラウザ上で実行できるデモアプリも公開されているので実際に使ってみました。

🎛️ ACE-Step V1.5 Playground💡
https://huggingface.co/spaces/ACE-Step/Ace-Step-v1.5

「Prompt」の欄に楽曲全体の説明、「Lyrics」の欄に歌詞を入力して「Generate Music」をクリック。

今回入力したプロンプトは以下。エレクトロニックなJ-POPを生成してみます。

An energetic, J-pop vocal performance over a driving electronic beat. The track is built on a foundation of punchy synth bass, crisp drum machine rhythms, and layered synthesizers. A powerful female vocal delivers catchy melodies in Japanese.

歌詞はこんな感じ

osusi daisuki. susi ga suki.
osoba daisuki. soba mo suki.
demo demo ichiban sukinanowa.
hamburger! hamburger! hamburger!
I like hamburger, my favorite food is hamburger!

完成した楽曲が以下。日本語は少し怪しいですが、英語の歌唱パートは完璧です。

音楽生成AI「ACE-Step 1.5」で日本語の楽曲を作ってみた - YouTube

ACE-Step 1.5のモデルデータは以下のリンク先で無料配布されています。ライセンスはMIT Licenseです。

ACE-Step/Ace-Step1.5 · Hugging Face
https://huggingface.co/ACE-Step/Ace-Step1.5

日本語のチュートリアルも用意されています。

ACE-Step 1.5 究極ガイド（必読） | ACE-Step-1.5/docs/ja/Tutorial.md at main · ace-step/ACE-Step-1.5 · GitHub
https://github.com/ace-step/ACE-Step-1.5/blob/main/docs/ja/Tutorial.md

またAI実行アプリのComfyUIでもすでにサポートされています。ComfyUI開発チームによると、4分の楽曲をGeForce RTX 3090で10秒以内、GeForce RTX 5090で1秒以内に生成できるそうです。

ACE-Step 1.5 just dropped in ComfyUI. Full songs in under 10 seconds. Less than 4GB VRAM. Open-source music generation just got serious. pic.twitter.com/nLYsx52dkq
— ComfyUI (@ComfyUI) February 3, 2026