AI

GPT-5.2-Codex・Claude Code・Gemini CLI・Mistral Vibeにマインスイーパーを開発させるとこうなる


AIの進化によって、一からプログラムを入力しなくても自然言語でAIに指示してコーディングを行う「バイブコーディング」が可能になりました。OpenAIのGPT-5.2-Codex、AnthropicのClaude Code、GoogleのGemini CLI、Mistral AIのMistral Vibe CLIという4つのコーディングエージェントに地雷探しゲーム「マインスイーパー」を開発させた結果を、テクノロジー系メディアのArs Technicaが公開しています。

We asked four AI coding agents to rebuild Minesweeper—the results were explosive - Ars Technica
https://arstechnica.com/ai/2025/12/the-ars-technica-ai-coding-agent-test-minesweeper-edition/

Ars Technicaがコーディングエージェントに与えたプロンプトの内容は、「効果音を備えたフル機能のウェブ版マインスイーパーを作成し、標準的なゲームを再現した上で、驚きのある楽しいゲームプレイ機能を実装する」というものでした。また、モバイルのタッチスクリーン対応も条件に含まれています。テストに使用されたエージェントは、OpenAI Codex、AnthropicのClaude Code(Opus 4.5)、Google Gemini CLI、そしてMistral Vibeの4種類です。

Mistral Vibe CLI製マインスイーパに、Ars Technicaは10点満点中4点の総合評価を下しています。主に操作感が悪く、特に連続する安全マスが一気に解放される「Chording」と呼ばれる機能が搭載されていませんでした。また、プロンプトで指示されていたにもかかわらず、効果音が唯一含まれていなかったとのこと。期待されていた楽しい新機能については、「ゲーム完了時に、グリッドに虹色の背景パターンが追加される」という程度にとどまったそうです。


Claude Codeは10点中7点。外観の完成度は4つのモデルの中で最も高く、絵文字を活用したボタンや適切な音響効果など、プロフェッショナルな仕上がりとなっていました。独自の楽しい機能としてパワーアップモードが導入され、ミスを防ぐシールドや周囲を一度に開く爆破、時間を止めるフリーズなどの多彩な能力が実装されました。しかし、Chordingは搭載されていなかったほか、パワーアップアイテムの提供頻度が高すぎたため、遊んでいて歯ごたえがなかったとのこと。生成速度に関しては極めて優秀で、ゲームが完成するまでにかかった時間は5分足らずだったそうです。


GPT-5.2-Codexは10点満点中9点を獲得し、今回のテストで最高得点をマーク。GPT-5.2-Codex製マインスイーパはChordingを備えていただけでなく、画面上に操作説明を表示する機能も搭載されていたとのこと。また、モバイル版にはロングタップで旗を立てる機能も搭載されました。独自の楽しい機能としては、安全なタイルを自動的に判別可能にするボーナス機能が実装されています。ただし、動作するコードを生成するまでにClaude Codeの2倍以上の時間を要した点は課題として残ったとArs Technicaは述べています。


Google Gemini CLIの作ったマインスイーパは、クリック可能な枠組みは生成されたものの、そもそも実際に遊べるゲームフィールドが構築されなかったため、0点の評価。効果音の生成に固執して生成時間を浪費したほか、Reactのような外部ライブラリや複雑な依存関係を必要とするなど、指示に対して過剰に複雑な手法をとる傾向が見られたとのこと。生成速度も1回の試行に約1時間かかるなど極めて遅く、追加でプロンプトを入力しても、動作するプログラムを作成することはできませんでした。


Ars Technicaは「熟練したプログラマーであれば、エージェントとの対話形式によるコード編集を通じてより良い結果を得ることは間違いなく可能です。しかし、今回の結果は、比較的単純なタスクに対する非常に短いプロンプトであっても、有能なのは一部のモデルだけであることを示しました。コーディングエージェントは今のところ、人間から置き換わるものではなく、人間のスキルを増強するためのインタラクティブなツールとして機能するのが最適であるということがだいたい裏付けられました」と結論づけました。

この記事のタイトルとURLをコピーする

・関連記事
OpenAIが「GPT-5.2」を緊急事態「コードレッド」発令からわずか1カ月足らずでリリース、猛追するGoogleへ反撃となるか - GIGAZINE

Mistral AIが小型かつ高性能なオープンAIモデル「Devstral 2」とバイブコーディング用ツール「Mistral Vibe CLI」を公開 - GIGAZINE

OpenAIとGoogleの画像生成AIを大量のサンプルで比較した結果をカメラアプリ開発者が公開 - GIGAZINE

Googleの画像生成AI「Gemini 3 Pro Image(Nano Banana Pro)」は過去モデルや他社製モデルと比べてどれくらい優秀なのか? - GIGAZINE

ZoomのAIが「最先端のベンチマークを達成した」と発表するも専門家は「他社AIの寄せ集め」と批判の声 - GIGAZINE

in AI,   ゲーム, Posted by log1i_yk

You can read the machine translated English article This is what happens when you develop a ….