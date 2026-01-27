2026年01月27日 11時13分 ハードウェア

Microsoft製AIチップ「Maia 200」が稼働開始、3nmプロセスで製造されGPT-5.2などの推論をサポート



Microsoftが、AIトークン生成の経済性を劇的に改善するために設計されたという推論アクセラレータ「Maia 200」を発表しました。料金当たりのパフォーマンスが大幅に向上しているということです。



Maia 200: The AI accelerator built for inference - The Official Microsoft Blog

https://blogs.microsoft.com/blog/2026/01/26/maia-200-the-ai-accelerator-built-for-inference/





Microsoft introduces newest in-house AI chip — Maia 200 is faster than other bespoke Nvidia competitors, built on TSMC 3nm with 216GB of HBM3e | Tom's Hardware

https://www.tomshardware.com/pc-components/cpus/microsoft-introduces-newest-in-house-ai-chip-maia-200-is-faster-than-other-bespoke-nvidia-competitors-built-on-tsmc-3nm-with-216gb-of-hbm3e



Maia 200はTSMCの3nmプロセスで製造されたチップで、前世代機と比較してドル当たりのパフォーマンスが30％向上しているのが特徴です。





加えて、216GBのHBM3E(7TB/s)と272MBのオンチップSRAMを備え、大規模モデルへの高速かつ高効率なデータ供給を実現するデータ移動エンジンを統合。1400億個以上のトランジスタを搭載し、大規模AIワークロード向けに最適化され、コスト効率に優れた性能を実現します。750W SoC TDP枠内でFP4(4ビット浮動小数点)で10ペタFLOPS以上、FP8(8ビット浮動小数点数)で5ペタFLOPS以上の性能を実現し、実用面では既存の最大規模モデルを容易に実行可能であり、将来のさらに大規模なモデルにも対応できる十分な余裕を備えているそうです。



他社製品と比較すると、第3世代Amazon Trainiumの3倍のFP4性能、Google第7世代TPUを上回るFP8性能を発揮するとのこと。





このほか、併用するメモリサブシステムでAI高速化におけるボトルネックが解消され、高帯域幅通信をローカルに維持することで最適な推論効率を実現するとしています。当初からデータセンターでの迅速かつシームレスな導入を想定して設計されており、データセンターへの導入にかかる時間は同等のシステムと比較して半分以下に短縮されているそうです。Microsoftは「当社のシリコン開発プログラムにおける中核原則は、最終シリコン提供前に可能な限りエンドツーエンドシステム全体を検証することです」と伝えました。



Maia 200はOpenAIのGPT-5.2モデルを含む複数のモデルに対応し、Microsoft FoundryやMicrosoft 365 Copilotにコスト効率の優位性をもたらすと説明されています。既にアイオワ州デモイン近郊の中部データセンター地域に導入済みで、次にアリゾナ州フェニックス近郊の西部データセンター地域に導入し、その後も順次展開予定とのこと。





また、Azureとシームレスに統合し、Maia 200向けモデルの構築・最適化ツール一式を備えたMaia SDKがプレビュー提供されています。PyTorch統合、Tritonコンパイラ、最適化カーネルライブラリ、Maiaの低レベルプログラミング言語へのアクセスなど、包括的な機能セットが用意されていて、開発者は異種ハードウェアアクセラレータ間での容易なモデル移植が可能になります。



Microsoftは「大規模AIの時代は始まったばかりであり、インフラがその可能性を決定づけます。当社のMaia AIアクセラレータプログラムは複数世代にわたる設計です。Maia 200をグローバルインフラに展開する中で、既に次世代設計を進めています」とも伝えました。

