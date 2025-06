2025年06月24日 12時10分 ソフトウェア

MicrosoftがCopilot+ PC向け小規模言語モデル「Mu」の詳細を発表、自然言語で話しかけるとWindowsの設定を変更できるAIエージェントに応用



Microsoftが2025年6月23日、小規模言語モデル(SLM)「Mu」の詳細を発表しました。Muは、PCなどのデバイス上で直接効率的に動作するように設計されており、複雑な推論を必要とするような状況に対応したモデルで、特にWindowsの「設定」画面で自然な言葉による操作を可能にするAIエージェントの頭脳として活用されています。



Muは、Copilot+ PCに搭載されているNPUの性能を最大限に引き出すように設計された、3億3000万パラメータのSLMです。これにより、インターネットに接続せずとも、デバイス上で高速に応答します。実際に、設定エージェントのシナリオでは毎秒100トークン以上、特定のタスクでは毎秒200トークンを超える処理速度を実現しています。



Microsoftは実際にMuが動作するところをムービーで公開しています。



Muは「エンコーダー・デコーダー」アーキテクチャを採用していおり、入力された文章(インプット)を固定の潜在表現に一度変換し、それをもとに出力(アウトプット)を生成します。これにより、インプットとアウトプットを毎回まとめて処理するデコーダーのみのモデルに比べ、計算量が大幅に削減され、高速な応答とメモリ消費の削減を実現します。





Microsoftによると、Qualcomm Hexagon NPU上で最初の応答にかかる時間は約47%短縮され、デコード速度は4.7倍向上したとのこと。



さらにMuは、モデル内の各計算レイヤーで正規化を行う「Dual LayerNorm」、文章中の単語の相対的な位置関係をモデルに学習させる「Rotary Positional Embeddings(RoPE)」、AIが文章のどこに注目すべきかを計算するAttentionを効率化する「Grouped-Query Attention(GQA)」といった最新技術を組み込むことで、少ないパラメータでより高い性能を引き出しています。





Muのトレーニングは複数の段階を経て行われました。Microsoftはまず、高品質な教育用テキストデータを大量に学習させ、言語の構文や基本的な知識を習得させました。次に、Microsoftの高性能モデル「Phi」が持つ知識を「蒸留」という手法で受け継がせることで、パラメータ効率を向上させています。



そして、最終的に特定のタスクに特化したデータでファインチューニングを行うことで、そのタスクにおける精度を劇的に高めます。この結果、Muはより大きなモデルである「Phi-3.5-mini」の10分の1のサイズでありながら多くのタスクで同等の性能を達成し、Microsoftは「設定」アプリ内に、まるで人と話すように自然な言葉で操作できるMuベースのAIエージェントを実装できたと述べています。



たとえば、ユーザーが「マウスのポインターが小さすぎる」といった日常的な言葉で入力すると、AIエージェントはその意図を理解し、「マウスポインターのサイズを1から3に変更します」といった具体的な設定変更を提案します。





こういったエージェントはこれまでにも開発されており、記事作成時点でCopilot+ PCには「Phi-Silica」がオンデバイスのSLMとして搭載されていますが、精度は十分ではあるものの、応答速度が課題だったとのこと。高速性と効率性に優れたMuをベースにし、360万件ものサンプルデータを使って集中的にファインチューニングを実施することで、500ミリ秒未満という高速な応答時間を実現しつつ、数百もの設定項目に対応可能な、信頼性の高いエージェントを実現できたとMicrosoftは論じました。



Microsoftは今後の展望として「設定におけるエージェントのエクスペリエンスを継続的に改善していくため、Windows Insiders Programのユーザーからのフィードバックをお待ちしています」と述べています。なお、MuベースのAIエージェントを試すには、バージョン 24H2のビルド26120.3964(KB5058496)以降をCopilot+ PCにインストールする必要があります。