ローカルで実行できる音楽生成AI「ACE-Step 1.5 XL」が登場、日本語ボーカル付き楽曲も生成可能

音楽生成AIの「ACE-Step 1.5 XL」が2026年4月2日にオープンモデルとして公開されました。ACE-Step 1.5 XLは2026年2月に登場した「ACE-Step 1.5」の強化版で、ローカルPCで実行して日本語ボーカル付き楽曲などを生成できます。
ACE-Step 1.5: Pushing the Boundaries of Open-Source Music Generation
https://ace-step.github.io/ace-step-v1.5.github.io/
ACE-Step-1.5-xl is out now.
— ACE Music (@acemusicAI) April 8, 2026
We scaled the DiT decoder to 4B. And it shows better audio quality, better prompt following, and better musicality. It still fast -- 8 steps with turbo distillation.
What didn't change:
- Same generation API, same LoRA training code, same everything… pic.twitter.com/P0YUFseEQ3
ACE-Step 1.5 XLはパラメーター数4BのDiTモデルで、自然言語で指示するだけでボーカル付きの楽曲を生成することができます。日本語のボーカルを生成することも可能で、ACE-Step 1.5 XLのデモページには日本語ボーカル付き楽曲も含まれています。
音楽生成AI「ACE-Step 1.5 XL」で生成された日本語ボーカル付き楽曲 - YouTube

ACE-Step 1.5 XLはオープンモデルとして開発されており、以下のリンク先でベースモデルの「acestep-v15-xl-base」、ファインチューニング済みモデルの「acestep-v15-xl-sft」、蒸留モデルの「acestep-v15-xl-turbo」の3種類が配布されています。
ACE-Step/acestep-v15-xl-base · Hugging Face
https://huggingface.co/ACE-Step/acestep-v15-xl-base
ACE-Step/acestep-v15-xl-sft · Hugging Face
https://huggingface.co/ACE-Step/acestep-v15-xl-sft
ACE-Step/acestep-v15-xl-turbo · Hugging Face
https://huggingface.co/ACE-Step/acestep-v15-xl-turbo
3種のモデルの主な違いは以下の通り。acestep-v15-xl-baseは最も多様性が高く、acestep-v15-xl-sftは品質を上げた代わりに多様性が下がっています。acestep-v15-xl-turboは高速かつ高品質な生成が可能ですが、多様性やファインチューン適正は低めです。実行に必要な最小VRAM容量は12GBで、推奨VRAM容量は20GB以上です。
| モデル | acestep-v15-xl-base | acestep-v15-xl-sft | acestep-v15-xl-turbo |
|---|---|---|---|
| ステップ数 | 50 | 50 | 8 |
| 品質 | Medium | High | Very High |
| 多様性 | High | Medium | Medium |
| ファインチューン適正 | Easy | Medium | Medium |
ACE-Step 1.5 XLはACE-Step 1.5と同じワークフローを使い回すことが可能。「ACE-Step 1.5 究極ガイド(必読)」と題した日本語チュートリアルも用意されています。
ACE-Step 1.5 究極ガイド(必読) · GitHub
https://github.com/ace-step/ACE-Step-1.5/blob/main/docs/ja/Tutorial.md

・関連記事
高品質な歌唱付き楽曲を爆速生成できる音楽生成AI「ACE-Step 1.5」が登場、VRAM容量4GB未満のPCでローカル実行可能でLoRAにも対応 - GIGAZINE
Googleが音楽生成AI「Lyria 3」を公開したので日本語ボーカル付き楽曲を作ってみた - GIGAZINE
Googleが音楽生成AI「Lyria 3 Pro」を発表、最大3分のボーカル付き楽曲を生成できる - GIGAZINE
ワーナーが音楽生成AI「Suno」と和解して提携することを発表 - GIGAZINE
歌詞から曲を作れる無料の音楽生成AIモデル「YuE」、日本語にも対応し複数の言語が混ざる楽曲も生成可能 - GIGAZINE
・関連コンテンツ
You can read the machine translated English article ACE-Step 1.5 XL, a locally executable mu….







