Amazonが音声認識アシスタントAlexaに生成AIを導入、複雑なリクエストを処理可能に
現地時間2023年9月20日にバージニア州アーリントンにあるAmazonの第2本社で開催された発表会において、Amazonが音声認識アシスタント・Alexaに生成AIを導入し、スマートスピーカー・Echoファミリー全体のエクスペリエンスを向上させることを発表しました。
Amazon previews the future of Alexa with generative AI
https://www.aboutamazon.com/news/devices/amazon-alexa-generative-ai
AmazonはAlexaを2014年に発表して以来、「Alexaとの会話を、他の人と話すのと同じぐらい自然にすること」を目指して継続的な改善を続けてきました。生成AIの急速な進化により、目標はもはや手の届くところまで来ているとのこと。
Amazonでは、Alexaとの会話を自然なものにするため、Echoのカメラ、音声入力、存在検出機能を、非言語的な合図を理解できるAIモデルと融合させました。また、会話が途切れず自然に続くように、そして応答が音声に適した長さになるように、遅延の短縮にも重点を置いたとのこと。
会話全体を通じた文脈も引き継いでくれるようになるので、たとえば「○○博物館に何月何日に行く予定」とスケジュールを伝えておけば、次に○○博物館について尋ねたときには文脈を踏まえた上で、訪問予定日の開館時間や催事、展示物などを教えてくれます。
また、人間は話の途中で考えをまとめるために一瞬黙ることがあります。AIはこの合図を解釈することが難しいのですが、新しい会話型音声認識(CSR)エンジンを構築したことにより、自然な沈黙も解釈して、流れるように自然な会話を実現します。
Alexaに求められるのは、自然な会話だけではなく、実際にアラームをセットしたり、スケジュールをメモしたりというアクション部分も同様です。新しいAlexa LLM(大規模言語モデル)は、人間と同じようにニュアンスやあいまいさを処理して、インテリジェントに行動できるように能力が強化されているほか、APIを介して何十万ものデバイスやサービスと接続されます。これにより、「平日は夜9時になったら子どもたちに寝る時間だと伝えて、2階の照明を暗くして、玄関のライトをつけて、寝室のファンをオンにして」という複雑な指示でもきっちりと処理してくれます。
新しいAlexaを使うとどんな感じになるのかという映像も公開されています。
"Alexa, let's chat." | Experience new Alexa capabilities - YouTube
帰宅して鍵を置いた女性が「アレクサ、おしゃべりしましょう」と呼びかけると、「どうしたの?」とAlexaが反応。
「昨日、サッカーの結果はどうだった?」との質問に「OLレインはポートランド・ソーンズに1-0で勝ちました」とAlexa。わざわざ「女子プロサッカー」や「OLレイン」というフレーズを入れて聞かなくても、これまでの文脈からOLレインのファンであることが伝わっています。
買ってきたものを冷蔵庫に入れつつ「かんたんに教えて」という女性に、Alexaは「OLレインは前半、しっかりした守りで支配率52%でした。後半、ポートランド・ソーンズにイエローカードが出て試合は白熱、55分にOLレインが先制点を挙げました」とスポーツニュースのように試合内容をまとめました。
このあとも、女性はパートナーと会話するかのようにAlexaとの会話を続けました。
新しいAlexaは、まずはアメリカのユーザー向けにまもなく提供される予定となっています。
・関連記事
Amazon Alexaは「巨大な失敗」と社員が吐露、損失は年間1兆4000億円のペースに - GIGAZINE
Amazonが7000億円以上の営業損失を出したAlexa含むデバイス事業などの「コスト削減のための事業見直し」を進めている - GIGAZINE
Amazon Echoがついにスマートホーム用標準規格「Matter」対応へ - GIGAZINE
Alexaユーザーの4人に1人は最初の1週間しか使っていない - GIGAZINE
・関連コンテンツ
in ソフトウェア, 動画, Posted by logc_nt
You can read the machine translated English article Amazon introduces generative AI to voice….