中国のAI企業MiniMaxが「M2.5」を発表、GPT・Gemini・Claudeに並ぶ性能でありながらコストは10分の1以下

中国上海に拠点を置くAI企業のMiniMaxは、実世界の生産性を飛躍的に高めるために設計されたフロンティアモデル「MiniMax M2.5」を発表しました。M2.5は数十万規模の複雑な実世界環境で強化学習を重ね、推論の効率化とタスク分解の最適化を実現したとしており、極めて高い処理速度と圧倒的なコスト効率を両立させているのが特徴です。
MiniMax M2.5: 更快更强更智能,为真实世界生产力而生 - MiniMax News | MiniMax
https://www.minimax.io/news/minimax-m25
Minimaxは、M2.5はプログラミング分野において前世代のM2.1から飛躍的な進化を遂げたとアピールし、主要なベンチマークであるSWE-Bench Verifiedで80.2%を記録したほか、Multi-SWE-Benchで51.3%、BrowseCompはコンテキスト管理を併用した条件で76.3%だったと説明しています。

以下はMinimax Mシリーズ(ピンク)のSWE-Bench Verifiedのスコア推移をAnthropic Claude(オレンジ)とOpenAIのGPT(黒)、GoogleのGemini(青)と比較したグラフ。

M2.5は特に「ソフトウェア設計者のように思考し計画を立てる能力」がポイントで、コードを書き始める前にプロジェクトの機能や構造、UIデザインを能動的に定義する仕様作成の傾向が備わっています。
また、Python、Java、Rust、Goを含む10種類以上の言語に対応し、20万を超える実世界の環境で学習したとした上で、開発環境のセットアップからシステム設計、機能の反復、そして最終的なコードレビューとテストに至る開発ライフサイクルの全工程をカバーできるとMinimaxは説明しています。また、ウェブ、Android、iOS、Windowsといった複数のプラットフォームに対応したフルスタックプロジェクトの遂行も可能です。

さらに、M2.5はエージェントが複雑なタスクを自律的に処理するための基盤となる検索およびツール呼び出し能力が大幅に強化されたとのこと。M2.5は前世代のM2.1と比べ、BrowseCompやWide Search、RISEといった複数のエージェントタスクで、探索のラウンド数を約20%減らしつつより良い結果を出したとしており、正答だけでなく効率的な経路で結論に到達する方向に推論が改善しています。また、BrowseCompやWide Searchなどのベンチマークで業界トップ級の性能を達成したとした上で、未知の環境でも安定して性能を出せる一般化性能が向上したとMinimaxは説明しています。

M2.5は実際の職場環境で即戦力となる成果物を出力することを目指して開発されています。金融、法律、社会科学の専門家と緊密に連携し、彼らの業界知識を学習パイプラインに取り入れることで、WordやPowerPoint、Excelを用いた財務モデリングなどの高価値な業務シナリオで顕著な改善を実現しているとのこと。社内の評価フレームワークであるGDPval-MMでは、他の主要なモデルに対して平均59.0%の勝率を記録しています。さらに、Excelのeスポーツ大会であるMEWCの問題を用いた評価でも、複雑な表計算やツール利用において優れた能力を発揮することが証明されています。

これらの技術的進歩を支えている中心的な要素は、強化学習の拡張です。自社開発のエージェントネイティブな強化学習フレームワークである「Forge」を導入し、エージェントとエンジンを完全に分離することで、ツールや足場の汎用性を最適化しました。非同期スケジューリングとツリー構造のサンプル統合戦略により、学習速度を約40倍に高めています。アルゴリズム面ではCISPOを継続して採用し、MoEモデルの安定性を確保するとともに、プロセス報酬メカニズムを導入して長いタスクにおける生成品質と応答速度の最適なバランスを実現しました。

MiniMax M2.5は「MiniMax Agent」という独自のプラットフォームに完全に統合されており、ユーザーはAPIを通じて高度なコーディングや検索、オフィス実務などの専用スキルを活用することが可能。モデルは処理速度とコストが異なる「M2.5」と「M2.5-Lightning」の2種類が提供されており、用途に応じた選択が可能です。
標準版のM2.5は1秒間に50トークンの出力が可能で、100万入力トークンあたり0.150ドル(約23.0円)、100万出力トークンあたり1.20ドル(約184円)となります。高速版であるM2.5-Lightningは1秒間に100トークンの出力を安定して提供し、料金は100万入力トークンあたり0.300ドル(約45.9円)、100万出力トークンあたり2.40ドル(約367円)に設定されています。
Minimaxは、M2.5は出力価格ベースで見ると他の主要なフロンティアモデルの10分の1から20分の1の安さだと述べた上で、出力100トークン毎秒で1時間連続稼働させた場合の費用は1ドル(約156円)で、出力50トークン毎秒なら0.30ドル(約47円)まで下がるとアピールしています。また、4つのインスタンスを24時間365日休まずに稼働させ続けても年間1万ドル(約156万円)の予算に収まるという例を示し、M2.5であればコストをほとんど気にすることなく高度なAIエージェントをビジネスに活用できると強調しました。
・関連記事
Gemini 3.0 ProやGPT-5.2に匹敵する中国製AI「GLM-5」が登場、Word文書作成などの事務作業も可能でモデルを自由にダウンロード可能 - GIGAZINE
業界最高水準の文字認識AI「GLM-OCR」をZ.aiがオープンソースで公開、ローカル環境でも動作できるほど軽量 - GIGAZINE
GPT-5.2やGemini 3 Proに匹敵するオープンソースAIモデル「Kimi K2.5」をMoonshot AIがリリース - GIGAZINE
AlibabaがGPT-5.2と同等性能の推論AIモデル「Qwen3-Max-Thinking」を発表 - GIGAZINE
gpt-oss-20bより高性能な中国製AI「GLM-4.7-Flash」が登場 - GIGAZINE
・関連コンテンツ
in AI, Posted by log1i_yk
You can read the machine translated English article Chinese AI company MiniMax announces 'M2….







