「Siri」の開発者による次世代音声認識AI「Viv」は複合的な質問にも対応可能


iPhoneに搭載されている音声認識アシスタント「Siri」は、元々はサードパーティーアプリとして開発されていたものをAppleが買収し、独自機能としてiOSに組み込んだものです。このSiriの生みの親であるDag Kittlaus氏が率いる人工知能スタートアップ・Viv Labsが、複合的な質問にも受け答え可能な既存の音声認識アシスタントを超越した音声認識AI「Viv」のデモンストレーションを2016年5月9日から11日までの3日間ニューヨークで開催されているライブイベント・TechCrunch Disruptの中で初めて披露しました。

TechCrunch Disrupt:Siriの共同ファウンダーが音声認識で会話する次世代AI、Vivアプリをデモ | TechCrunch Japan
http://jp.techcrunch.com/2016/05/10/20160509siri-creator-shows-off-first-public-demo-of-viv-the-intelligent-interface-for-everything/

The creators of Siri just showed off their next AI assistant, Viv, and it's incredible | The Verge
http://www.theverge.com/2016/5/9/11639992/viv-digital-assistant-ai-artificial-intelligence-siri

iOSに搭載されている音声認識アシスタントのSiriは、話しかけるだけでメッセージを送ったりスケジュールを設定したり電話をかけたりすることができる機能です。ただし、Siriは連携可能なアプリの数が制限されているため「飛行機のチケットを予約したい」「Apple Storeで販売している商品を購入して」といった質問を行うと、「Web検索でこちらが見つかりました」もしくは「私には"質問内容"の意味がわかりません。Webで検索してみましょうか?」と表示され、結局欲しい情報をウェブ上で検索する羽目になります。さらに、Siriはひとつ質問に答えると質問内容を忘れてしまうので、会話をするように「質問を積み重ねることができない」という欠点もあります。


それに対してKittlaus氏が開発する音声認識AIのVivは、複数のサードパーティー製アプリとの連携が可能で、例えば「昨日の飲み代20ドルを○○さんに払って」と言えば、あと1回画面をタップすれば送金ツールVenmoから友人に飲み代を支払える状態にしてくれる模様。他にもVivは、会話のように「質問を積み重ねることが可能」であるため、連続して質問すれば質問内容をフォローするよう適切な反応をとってくれるとのこと。

実際のVivのデモンストレーションの様子および、TechCrunch DisruptでKittlaus氏が明かしたVivの全容は以下のムービーで知ることが可能です。

Viv Recap - YouTube


TechCrunch Disruptのイベントに登場したDag Kittlaus氏。Kittlaus氏は密かに開発を進めてきた音声認識アシスタント「Viv」のデモを初披露するためにステージに登壇しています。


Kittlaus氏はVivは人工知能関連のテクノロジーにとって次世代のパラダイムになるとコメントしています。


Vivは「人工知能」「機械学習」「サードパーティーサービスとの統合」を同時に実現しており、これにより既存の音声認識アシスタントよりも便利なものに仕上がっているとのこと。


Vivは複合的な質問にも簡単に対応可能。例えば「アダムに昨夜の飲み代20ドルを返しておいて」と語りかけると……


「Send $20」をタップすればサードパーティー製アプリからアダムに20ドルを支払えるようになります。


他にも、「明後日の午後5時以降、ゴールデンゲートブリッジの近くは華氏70度(21℃)よりも暑くなる?」と質問すれば、ただ天気予報を表示するだけでなく「いいえ、水曜日は5時以降に華氏70度を超えることはありません」と教えてくれます。


なお、Kittlaus氏は「コンシューマーにとってはVivのようなインテリジェンスインターフェイスが全てになる」「デベロッパーにとっては、Vivのようなより賢い音声認識アシスタントがコンテンツ提供のための次の大きな市場およびチャンネルになる」としています。


さらに、大胆にもVivのアイコンはBluetoothやWi-Fiのアイコンのように、すぐに認知されるようになるとしています。


なお、Vivが自然言語による質問に柔軟に対応できるのは、固定のプログラムに基づいて反応を返すのではなく、質問を理解するとそれに答えるためにプログラムを動的に生成するからだそうです。Kittlaus氏は「プログラマー側で処理コードを1行ずつ書く必要なしに、Vivは尋ねられたことに答えるための処理プログラムを自ら書くことができます。Vivの最大のメリットは、アプリのプログラマーがVivに必要な反応さえわかっていればいいという点です」と語っています。

Dag Kittlaus氏によるVivのデモンストレーションの様子を収めたムービーのフルバージョンは以下から見られます。

Beyond Siri: The World Premiere of Viv with Dag Kittlaus - YouTube

・関連記事
Siriをはるかに越えるAIを備えたSiri開発者らによる新音声認識システム「Viv」がまもなく公開へ - GIGAZINE

「Siri」対「Google Now」対「Cortana」、質問に正しく回答できるかどうか対決の勝者は? - GIGAZINE

Siriの開発者が複合的な質問を理解できる新しい音声認識AIを開発中 - GIGAZINE

Googleが自社で使っている「クラウド機械学習」を一般に開放、こんなスゴイことが簡単にできる - GIGAZINE

Googleが人間以上の能力を持つ画像認識AI「PlaNet」を開発していることが明らかに - GIGAZINE

「死体をどこに隠したらいい?」とSiriに隠し場所を尋ねた殺人事件が発生 - GIGAZINE

117

in ソフトウェア,  動画, Posted by logu_ii