ソフトウェア

Amazonが音声認識アシスタントAlexaに生成AIを導入、複雑なリクエストを処理可能に


現地時間2023年9月20日にバージニア州アーリントンにあるAmazonの第2本社で開催された発表会において、Amazonが音声認識アシスタント・Alexaに生成AIを導入し、スマートスピーカー・Echoファミリー全体のエクスペリエンスを向上させることを発表しました。

Amazon previews the future of Alexa with generative AI
https://www.aboutamazon.com/news/devices/amazon-alexa-generative-ai


AmazonはAlexaを2014年に発表して以来、「Alexaとの会話を、他の人と話すのと同じぐらい自然にすること」を目指して継続的な改善を続けてきました。生成AIの急速な進化により、目標はもはや手の届くところまで来ているとのこと。

Amazonでは、Alexaとの会話を自然なものにするため、Echoのカメラ、音声入力、存在検出機能を、非言語的な合図を理解できるAIモデルと融合させました。また、会話が途切れず自然に続くように、そして応答が音声に適した長さになるように、遅延の短縮にも重点を置いたとのこと。


会話全体を通じた文脈も引き継いでくれるようになるので、たとえば「○○博物館に何月何日に行く予定」とスケジュールを伝えておけば、次に○○博物館について尋ねたときには文脈を踏まえた上で、訪問予定日の開館時間や催事、展示物などを教えてくれます。

また、人間は話の途中で考えをまとめるために一瞬黙ることがあります。AIはこの合図を解釈することが難しいのですが、新しい会話型音声認識(CSR)エンジンを構築したことにより、自然な沈黙も解釈して、流れるように自然な会話を実現します。

Alexaに求められるのは、自然な会話だけではなく、実際にアラームをセットしたり、スケジュールをメモしたりというアクション部分も同様です。新しいAlexa LLM(大規模言語モデル)は、人間と同じようにニュアンスやあいまいさを処理して、インテリジェントに行動できるように能力が強化されているほか、APIを介して何十万ものデバイスやサービスと接続されます。これにより、「平日は夜9時になったら子どもたちに寝る時間だと伝えて、2階の照明を暗くして、玄関のライトをつけて、寝室のファンをオンにして」という複雑な指示でもきっちりと処理してくれます。

新しいAlexaを使うとどんな感じになるのかという映像も公開されています。

"Alexa, let's chat." | Experience new Alexa capabilities - YouTube


帰宅して鍵を置いた女性が「アレクサ、おしゃべりしましょう」と呼びかけると、「どうしたの?」とAlexaが反応。


「昨日、サッカーの結果はどうだった?」との質問に「OLレインはポートランド・ソーンズに1-0で勝ちました」とAlexa。わざわざ「女子プロサッカー」や「OLレイン」というフレーズを入れて聞かなくても、これまでの文脈からOLレインのファンであることが伝わっています。


買ってきたものを冷蔵庫に入れつつ「かんたんに教えて」という女性に、Alexaは「OLレインは前半、しっかりした守りで支配率52%でした。後半、ポートランド・ソーンズにイエローカードが出て試合は白熱、55分にOLレインが先制点を挙げました」とスポーツニュースのように試合内容をまとめました。


このあとも、女性はパートナーと会話するかのようにAlexaとの会話を続けました。


新しいAlexaは、まずはアメリカのユーザー向けにまもなく提供される予定となっています。

この記事のタイトルとURLをコピーする

・関連記事
Amazon Alexaは「巨大な失敗」と社員が吐露、損失は年間1兆4000億円のペースに - GIGAZINE

Amazonが7000億円以上の営業損失を出したAlexa含むデバイス事業などの「コスト削減のための事業見直し」を進めている - GIGAZINE

Amazon Echoがついにスマートホーム用標準規格「Matter」対応へ - GIGAZINE

Alexaユーザーの4人に1人は最初の1週間しか使っていない - GIGAZINE

in ソフトウェア,   動画, Posted by logc_nt

You can read the machine translated English article here.