ソフトウェア

Microsoftがリアルタイムでゲームを生成するAIモデル「WHAMM」をリリース、「Quake II」を使ったデモもプレイ可能


Microsoftが2025年4月4日に、プレイヤーの操作にリアルタイムで応答し、ゲーム環境を生成できるAIモデル「World and Human Action MaskGIT Model(WHAMM)」をリリースしました。これに合わせ、1997年発売のシューティングゲーム「Quake II」をAIが再現したデモをプレイすることが可能です。

WHAMM! Real-time world modelling of interactive environments. - Microsoft Research
https://www.microsoft.com/en-us/research/articles/whamm-real-time-world-modelling-of-interactive-environments/


Microsoft has created an AI-generated version of Quake | The Verge
https://www.theverge.com/news/644117/microsoft-quake-ii-ai-generated-tech-demo-muse-ai-model-copilot

Microsoft releases AI-generated Quake II demo, but admits ‘limitations’ | TechCrunch
https://techcrunch.com/2025/04/06/microsoft-releases-ai-generated-quake-ii-demo-but-admits-limitations/

WHAMMのデモは以下のリンクから利用できます。

Microsoft Copilot: Copilot Gaming Experience
https://copilot.microsoft.com/wham

ユーザーが18歳以上である場合「Agree」をクリックしてプレイ開始。


実際のゲームプレイが以下。操作には非常に大きなラグがあり、快適にプレイすることは困難です。

Microsoftのゲーム生成AIモデル「WHAMM」を使った「Quake II」のデモ - YouTube


プレイできるのは120秒間で、制限時間に達すると「Game Over」と表示されます。


今回Microsoftが発表したWHAMMは、2025年2月に発表された「World and Human Action Model(WHAM)の改良版とも呼べるAIモデルで、プレイヤーの操作に合わせてAIがリアルタイムでゲームの画面を生成するというものです。

WHAM-1.6Bは1秒間に約1フレームの生成しかできなかった一方でWHAMMは毎秒10フレーム以上を生成可能です。そのため、プレイヤーのキーボードやコントローラー操作に即座に反応するリアルタイムな描写が可能とのこと。

従来のWHAMでは、大規模言語モデルのようにトークンを1つずつ生成するモデリング方法を採用していました。


しかし、このモデリング方法には「高品質だが生成に時間がかかる」という課題がありました。そこでMicrosoftはWHAMMにおいて「MaskGIT」と呼ばれるアーキテクチャを採用しました。これは、画像全体のトークンを一度に生成し、その後一部のトークンをマスクして再度予測・修正するという手法で、この手順を反復することで画像予測を徐々に洗練させることが可能です。


少ない計算ステップでリアルタイムな応答を実現するために、WHAMMは画像全体のトークンの初期予測を生成する約5億パラメーターの「Backbone」transformerと、初期予測を絞り込んで精密化を行う約2億5000万パラメーターの「Refinement」transformerを採用しています。これにより、MaskGITステップを何度も反復して実行することが可能になり、より良い最終予測を確実に行うことができるそうです。

一方でMicrosoftは現時点でのWHAMMの課題も挙げています。
・敵とのインタラクション:敵キャラクターがぼやけて表示されたり、戦闘ダメージの計算が不正確だったりといった問題
・コンテキストの長さ:記事作成時点でのWHAMMのコンテキスト長は10fpsにつき9フレームであるため、0.9秒間視界から外れた敵やオブジェクトが消失してしまうという問題
・数値の正確性:残り体力などの数値が不正確になる問題
・範囲の制限:WHAMMはQuake IIの一部分でしか訓練されていないため、エリアの終点に到達すると生成が停止してしまう問題
・遅延:WHAMMを誰でも試せるようにウェブブラウザ経由で公開したことによる、操作に対する遅延が発生する問題

Microsoftは「このWHAMMモデルは、リアルタイムで生成されたゲームプレイエクスペリエンスの初期の実験です。私たちは、こうしたモデルによってどのような新しいインタラクティブメディアが実現可能になるかを探求することにワクワクしています」と述べています。

この記事のタイトルとURLをコピーする

・関連記事
ゲーム生成AIモデル「Muse」をMicrosoftが発表、ビジュアルやプレイヤーのコントローラー操作に基づいて新たなゲームを生成可能 - GIGAZINE

スーパーマリオのプレイ映像を学習してテキストからゲーム動画を自動生成するAIモデル「MarioVGG」 - GIGAZINE

Googleの研究チームがゲームエンジンとして機能するAIモデル「GameNGen」を発表、入力に合わせて20fpsでDOOMを描画可能で実際のプレイムービーもあり - GIGAZINE

3000人以上のゲーム開発者を対象とした調査レポート「2025 GDC State of the Game Industry」でゲーム業界の最新事情が明らかに、回答者の11%が過去1年で解雇&30%が「生成AIが業界に悪影響を及ぼしている」と意見 - GIGAZINE

AIアシスタントが配信中にコメントを読んだりクリップを作成したり完全自動で演出したりできる次世代配信支援システム「Intelligent Streaming Assistant」をStreamlabsが発表 - GIGAZINE

リアルタイムでプレイ中のゲームのヒントを伝えるコーチングAI「Project AVA」をRazerが発表 - GIGAZINE

NVIDIA製グラボやAppleチップのAI推論処理能力をまとめた一覧表、どのグラボやMacを買えばいいのかの参考になる - GIGAZINE

AIツールの次のレベル「AIエージェント」とは何なのか専門家が解説 - GIGAZINE

in レビュー,   ソフトウェア,   動画,   ゲーム, Posted by log1r_ut

You can read the machine translated English article Microsoft releases AI model 'WHAMM' that….