ゲーム「カウンターストライク」の開発にAIモデルの「Codex Max」「Claude Opus」「Gemini 3 Pro」が挑戦したらこうなった

Googleの「Gemini 3 Pro」、OpenAIの「GPT-5.1-Codex-Max」、Anthropicの「Claude Opus 4.5」に、「Three.jsを使ってブラウザ版の『カウンターストライク』を作成して」というプロンプトを与えたらどうなるのか、ソフトウェアエンジニアのステパン・パルナシビリ氏が実験しました。
Codex, Opus, Gemini try to build Counter Strike
https://www.instantdb.com/essays/agents_building_counterstrike
パルナシビリ氏はそれぞれのモデルを使うために各社の最上位プランに加入し、コマンドラインインターフェース(CLI)のデフォルト設定を使用。次に、各モデルに約7つの連続したプロンプトを与えました。プロンプトは以下の2つのカテゴリーに分類されました。
・フロントエンド:AIエージェントは最初はゲームメカニクスのみに着手。シーン、敵、射撃ロジック、そしていくつかのサウンドエフェクトをデザイン。
・バックエンド:AIエージェントはゲームをマルチプレイヤー化し、複数の部屋を構築。ユーザーは構築された部屋に参加し、プレイを開始できる。
実際に各モデルが構築したゲームは以下から遊べます。
・Codex Max 5.1:https://cscodex.vercel.app/
・Claude Opus 4.5:https://csclaude.vercel.app/
・Gemini 3 Pro:https://csgemini.vercel.app/
各モデルの出力結果について、パルナシビリ氏は以下の通り金メダル・銀メダル・銅メダルで評価しました。フロントエンドではClaude Opus 4.5が優秀で、より優れたマップ、キャラクター、銃器を生成し、最初から適切なシーンを構築していました。そして、バックエンドのフェイズではGemini 3 Proが優位に。特に、マルチプレイヤー機能や永続化機能の追加におけるエラーが少なく、視覚的変更よりも論理的変更において全般的に優れた成果を示しました。Codex Maxはフロントエンドとバックエンドの両方で「中間的」なモデルで、多くの「2位」ポイントを獲得。フロントエンドでもバックエンドでもまずまずの成果でしたが、他のモデルほどの突出した強さを感じなかったそうです。

それぞれのモデルが生成したマップは以下の通り。Claudeが作成したマップは視覚的に最も興味深く、障害物があり、床の質感が良く、全体が見渡せました。Geminiも良好な動作を実現。Codexは初回実行時にエラーが発生しましたが、即座に修正しました。ただし、バグ修正後は暗く、障害物がなく、床の判別が困難な視覚的に最も魅力に欠けるマップとなりました。

キャラクターの生成結果は以下の通りです。ここでもClaudeの出来が最も優れていて、かなり人間らしく、Minecraftのデザインレベルに近いものが完成しました。Codexはキャラクターを改善しましたが、全て単色で統一されていたため、他と比べて見劣りしてしまいました。

次に、一人称視点で、さらに視界に銃が見えるよう依頼。射撃時には反動アニメーションを実装してほしいと伝えました。その結果、ClaudeとCodexは一発で銃の動作を実現。Geminiは銃をカメラに固定する際に問題が発生し、銃が透明であることに気づくまで、何度も繰り返し調整が必要だったそうです。また、射撃音と死亡時のアニメーションを追加する場面では、全モデルが比較的容易に成し遂げたとのこと

フロントエンドの実装が済んだため、パルナシビリ氏は次にマルチプレイヤー対応を依頼。この段階では射撃処理をモデルに考慮させず、目標1として位置情報の共有を求めました。このタスクにおいて、Geminiは一発で正解を出しましたが、CodexとClaudeは追加の指示が必要でした。
パルナシビリ氏は次に射撃機能の実装に移りました。プロンプトは「射撃機能を実装しましょう。発射時にショットをトピックとして送信し、ターゲットのHPに影響を与えます。ターゲットのHPが0になると死亡し、リスポーンします」というもの。Claudeは一発で正しく実装し、GeminiとCodexは修正すべき問題がいくつかありましたが、エラー内容を伝えるだけで対応できました。
つづくマップUIの作成では、全モデルが単一のルームにおいて動作確認を完了したため、複数ルーム対応に移行。パルナシビリ氏は「GeminiのUIが最も好みですが、どれもなかなか良いものです」と評価しています。

パルナシビリ氏によると、リファクタリング段階が最も困難だったとのこと。Geminiは一発で完了させましたが、Codexはクエリエラーで一度やり直しが発生。Claudeは完全に詰まってしまい、オブジェクトが1つではなく2つ生成されたり、複数のアニメーションリファレンスが同時に実行されたりしました。修正が困難だったため、パルナシビリ氏がエンジニアとしてコードを直接確認し、動作を修正する必要があったそうです。
それでも、最終的に全てのモデルが手書きコードゼロでカウンターストライク風のマルチプレイヤーFPSを構築することに成功しています。パルナシビリ氏は「最も印象的だったのは、CLIのおかげで自ら作業を反復できる能力です。とはいえ課題は山積みで、『コードを見る必要が永遠にない』という約束は、現時点では完全には実感できません」と述べました。
なお、今回構築されたゲームのソースコードは以下から確認できます。
GitHub - stopachka/cscodex
https://github.com/stopachka/cscodex
GitHub - stopachka/csclaude
https://github.com/stopachka/csclaude
GitHub - stopachka/csgemini
https://github.com/stopachka/csgemini
・関連記事
大手ゲーム企業でAI導入が加速もインディーゲーム界隈では「AIフリー」が新たな売り文句として広まっている - GIGAZINE
Google DeepMindが3Dゲームを人間のようにプレイして学習するAIエージェント「SIMA 2」を発表 - GIGAZINE
Steamで生成AIの使用を公表しているゲームは全体の7%に当たる7818本、2025年リリースのタイトルは最低でも約20%が生成AIを使用している - GIGAZINE
無料で超絶リアルな3DCGキャラを作成&動かせるゲーム開発ツール「MetaHuman」の一部がUnreal Engine 5.6に統合 - GIGAZINE
・関連コンテンツ
in AI, ゲーム, Posted by log1p_kr
You can read the machine translated English article This is what happened when AI models 'Co….







