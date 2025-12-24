2025年12月24日 14時45分 AI

AIモデル「MiniMax M2.1」登場、一部テストでGemini 3.0 ProやGPT-5.2を超えるスコアを記録



AI企業のMiniMaxがマルチモーダルモデル「MiniMax M2.1」を発表しました。「エージェント時代の最強オープンソースモデル」をうたっており、一部のベンチマークではGemini 3 ProやClaude 4.5 Sonnetを上回るスコアを記録しています。



MiniMax M2.1: Significantly Enhanced Multi-Language Programming, Built for Real-World Complex Tasks - MiniMax News

https://www.minimax.io/news/minimax-m21







MiniMax M2.1 is officially live🚀

Built for real-world coding and AI-native organizations — from vibe builds to serious workflows.



A SOTA 10B-activated OSS coding & agent model, scoring 72.5% on SWE-multilingual and 88.6% on our newly open-sourced VIBE-bench, exceeding leading… pic.twitter.com/pnQG53H7rM — MiniMax (official) (@MiniMax__AI) December 23, 2025



MiniMax M2.1の特徴は以下の通り。



◆複数のプログラミング言語への卓越した対応力

これまでの多くのAIモデルはPythonへ最適化することに重点を置いていましたが、実際には世の中のシステムはPythonだけではなく複数のプログラミング言語で構築されていることが一般的です。MiniMax M2.1はRust、Java、Golang、C++、Kotlin、Objective-C、TypeScript、JavaScriptなど、複数のプログラミング言語の対応力を体系的に強化しているので、多言語タスクでの総合的パフォーマンスは業界トップレベルであり、低レベルシステムからアプリケーション層の開発までの一連を完全にカバーしているとのこと。



◆Web開発とアプリ開発の強化

ネイティブAndroidとiOSの開発機能を大幅に強化し、モバイル開発の弱点を解決しているとのこと。また同時に設計理解力と美的表現力についても体系的に強化することで、3Dの科学的シーンのシミュレーションや高品質なビジュアライゼーションも実現。バイブコーディングを持続可能で実用的な制作手法に進化させたとのこと。



◆「複合命令制約」強化によるオフィスシナリオの実現

Claudeで導入された、応答の途中に思考プロセスを挟み込む「インターリーブ思考」を体系的に導入した最初のオープンソースモデルシリーズの1つとして、MiniMax M2.1は体系的な問題解決能力がさらに強化されています。コード実行の正確性だけでなく、「複合命令制約」の統合的な実行を重視することで、現実的なオフィスシナリオでより高い実用性が提供されます。



◆応答を簡潔でより効率的に

MiniMax M2と比較して、MiniMax M2.1は応答と思考の連鎖がより簡潔になっています。プログラミングや対話では応答速度が大幅に向上しトークン消費量も激減するため、AIコーディングやエージェント駆動の継続的ワークフローにおいて、よりスムーズで効率的なパフォーマンスが発揮できます。



◆エージェント・ツールの優れた汎化能力

MiniMax M2.1はClaude Code、Droid(Factory AI)、Cline、Kilo Code、Roo Code、BlackBoxなど様々なプログラミングツールやエージェントフレームワークで一貫性と安定性を発揮し、Skill.mdなどのコンテキスト管理メカニズムを確実にサポートします。



◆高品質な対話と文章生成

単に「コーディング能力に優れている」だけでなく、日常会話や文書作成などのタスクでも、詳細で構造化された応答が提供されます。



以下はMiniMax M2.1とM2、DeepSeek V3.2、Claude Sonnet 4.5、Gemini 3 Pro、GPT-5.2(thinking)を10種類のベンチマークテストで比較したグラフ。複数のテストで、MiniMax M2.1が他を上回るスコアを記録しています。

