Appleが初めて明かすディープラーニングによる人工知能開発秘話
By Vincent Noel
IT関連メディアのBackchannelが、Appleのインターネットソフトウェア&サービス上級副社長のエディー・キュー氏、ソフトウェアエンジニアリング上級副社長のクレイグ・フェデリギ氏、Siri担当シニアディレクターのアレックス・アチェロ氏などそうそうたるメンバーにインタビューを実施し、Siriを始めとするAppleが行ってきた人工知能開発について初めて明かされました。
An Exclusive Look at How AI and Machine Learning Work at Apple – Backchannel
https://backchannel.com/an-exclusive-look-at-how-ai-and-machine-learning-work-at-apple-8dbfb131932b
iPhoneに搭載されている音声認識アシスタント「Siri」は、2011年にリリースされたiPhone 4Sに初めて搭載されたものの、肝心の音声認識機能の精度に問題があり、ユーザーから不満の声があがっていたとのこと。Appleは問題を改善するために、Siriの音声認識をニューラルネットワークを基本としたシステムに変更。この変更は2014年7月にアメリカで配信され、同年8月に世界に向けて配信されましたが、Appleはユーザーに機能を改善したという通知を行いませんでした。
By Dave Schumaker
Siriのスピーチチームを率いるアレックス・アチェロ氏は「システムをニューラルネットワークベースに変更することで、Siriのエラーレートは以前の半分くらいまで少なくなりました。これには機械学習のディープラーニングが大きく貢献しています。また、ディープラーニングをどうやって最適化したかもエラーレートが大きく下がった理由の1つです」とインタビューで話しました。
ディープラーニングとは、人間の脳を模倣した仕組みのニューラルネットワークを採用した機械学習の手法の1つで、画像や音声認識などのパターン認識処理に向いています。このディープラーニングを利用してSiriの認識精度は大きく向上したわけですが、そこにはAppleならではの開発背景がありました。
GoogleがOSの開発を行い、メーカーが端末の開発を行うAndroid端末とは異なり、AppleはiOS・iPhoneというソフトウェアとハードウェアの両方の開発を手がけています。Siriにディープラーニングを利用する際にも、ディープラーニングの能力を最大限発揮できるようにソフトウェアとハードウェアの両方の開発者たちの間でコミュニケーションを取りながら開発が行われたとのこと。
ソフトウェアエンジニアリング上級副社長のクレイグ・フェデリギ氏は「ディープラーニングの能力を最大限に発揮するには、マイクを何基搭載するか、マイクをどこに設置するかなど、ハードウェアとマイク、そして音声を処理するソフトウェアスタックを適切に調整する必要があります。種類の異なる楽器で演奏するコンサートのようなものですね。音声認識システムの開発において、ハードウェアとソフトウェアの両方を開発するAppleは、どのような端末に搭載されるかわからない音声認識ソフトウェアを開発している企業と比べて大きなアドバンテージを持っていました」と語っています。
By Martin Hajek
Appleのディープラーニングの技術はSiriだけで活躍しているのではありません。ユーザーが開こうとしているアプリを予測してショートリストを作ったり、カレンダーに登録されていない予定の通知をしたり、検索する前に予約しているホテルの場所を教えてくれたりなど、こういった機能はAppleがディープラーニングやニューラルネットワークを採用したからこそ実現しているそうです。
ただし、ディープラーニングの能力を最大限発揮するには、ユーザーのデータを集めて「学習すること」が非常に重要になります。例えば、iPhoneではユーザーがQuickTypeキーボードで入力したテキスト情報はニューラルネットワークによって監視され全て収集されているそうですが、収集されたデータはサーバーには送られずデバイスに保存されているそうです。ディープラーニングによるユーザーエクスペリエンスの向上を計りつつ、ユーザーデータのセキュリティも重視しているというわけです。
キュー氏は「『Appleはユーザーデータを所有していないからAIの開発で遅れをとっている』という人がいますが、我々はプライバシーを保護しつつ必要なデータを収集する方法を見つけています」とインタビューで話しました。キュー氏が話したプライバシーを保護しつつ必要なデータを収集する方法というのは、2016年秋に登場するとみられているiOS 10に導入予定の「Differential Privacy(ディファレンシャル・プライバシー)」という技術です。ディファレンシャル・プライバシーはユーザーの使用パターンのサンプルを集め、そこにランダムなデータを加えることで個人の特定をすることなくデータを解析できるというもので、iOS 10のメッセージアプリ・テキストや絵文字の予測変換・Notesアプリ・Spotlightで使用されます。
また、ディープラーニングはiPhoneだけではなくスタイラスペンのApple Pencilにも活用されています。Apple Pencilにはパームリジェクションという機能が搭載されていて、これはiPadのディスプレイがApple Pencilを使っているユーザーの手に反応しないようにするというもの。パームリジェクションのおかげで、ユーザーは手を置く場所を気にせずに作業に集中できるようになっています。
By Aaron Yoo
ディープラーニングは、Apple Pencilによる操作と手によるタッチやスワイプといった操作の違いを認識する技術を支えているとのこと。フェデリギ氏は「パームリジェクションが正確に動作しなかったら書く気が起こらないでしょう。そうなればApple Pencilは優れた製品ではありません」と話しています。
・関連記事
Microsoftが人工知能でGoogleに勝てる理由とは? - GIGAZINE
人工知能・機械学習・IoTがいかにソフトウェア開発のカギとなってくるのかが分かるグラフが公開中 - GIGAZINE
Googleの人工知能で失明を防げるようにする研究がスタート - GIGAZINE
Twitterが人工知能・機械学習のスタートアップを買収、何に使うのか? - GIGAZINE
Googleの人工知能「DQN」が人間より上手にプレイできるゲームとできないゲームの境界線 - GIGAZINE
Googleの人工知能専門チームDeepMindがたった数カ月で40%もGoogleデータセンターの冷却システムを効率化することに成功 - GIGAZINE
・関連コンテンツ