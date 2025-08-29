Microsoftが自社製として初の音声生成AI「MAI-Voice-1 AI」と基盤モデルの「MAI-1-preview」を発表
MicrosoftのAI部門はMicrosoftで独自に設計・構築・訓練されたAIモデルの「MAI」を開発しています。Microsoftは2025年8月28日に、MAIファミリーから初めてとなる音声モデル「MAI-Voice-1 AI」と基盤モデル「MAI-1-preview」を発表しました。
Two in-house models in support of our mission | Microsoft AI
https://microsoft.ai/news/two-new-in-house-models/
MAI-Voice-1 AIは表現力豊かで自然な音声が生成できるAIモデルで、ニュースや天気などを要約して読み上げる「Copilot Daily」や、ポッドキャスト形式のディスカッションを生成する機能など、MicrosoftのAIアシスタント「Copilot」の一部機能で利用可能です。
MAI-Voice-1 AIは、Copilotに関する新機能などを試すことができるCopilot Labsからアクセスして無料で試用できます。
Copilot Labsの「Copilot Audio Expressions」では、まずモードを「感情」と「ストーリー」から選びます。「感情」の場合は声色や感情を選択肢から選び、「ストーリー」モードでは全てプロンプトだけで指定します。
「音声」では、読み上げる音声の雰囲気や声色、イギリスなまりの英語かアメリカなまりの英語かを選択可能。
「スタイル」では、「Joy(楽しげに)」「Sadness(悲しそうに)」など音声の感情を選びます。
テキストを入力したら「生成」をクリック。
約30秒の音声が生成されました。入力したテキストを読み上げるのではなく、テキストを元に短いスピーチを作ってくれるようなイメージです。
また、MAI-1-previewは大規模言語モデル(LLM)の公開WebベースのプラットフォームであるLMArenaでテストを公開しています。MAI-1-previewは約1万5000基のNVIDIA H100 GPUを用いて事前学習および事後学習されたMicrosoftのMixed-of-Experts(MoE)モデルです。
Microsoftによると、MAI-1-previewは日常的な質問や指示に従って役立つ回答を提供することに特化したモデルを求める消費者に、強力な機能を提供するように設計されているとのこと。MAI-1-previewは数週間かけて、Copilot内のテキストユースケースで展開することで、ユーザーからのフィードバックを得て改善していく予定です。
Microsoft AIはブログの中で「私たちは、次の一歩として大きな野望を抱いています。AI分野でさらなる進歩を追求するだけでなく、様々なユーザーの意図やユースケースに対応する専用モデルを統合することで、計り知れない価値を生み出すことができると信じています。近い将来、MicrosoftのAIチームは、AIと機械学習の両面で、さらに多くの成果を生み出すでしょう。私たちは、最先端のモデルを世界中の人々に届けることを目指しており、今後の取り組みに期待を寄せています」と述べています。
