スティーブン・ホーキング博士が失った「声」を再び得るようになるまでの物語
「車いすの物理学者」としても知られるスティーブン・ホーキング博士は、筋萎縮性側索硬化症(ALS)を煩いながらも現代宇宙論に多大なる影響を与える研究を続けるイギリスの理論物理学者です。ホーキング博士はインテルの創始者ゴードン・ムーア氏の申し出を受けて、1997年から指や頬だけで操作できる最新のカスタマイズPCの提供を受けており、合成音声によってスピーチや講義を行っていますが、そんなホーキング博士の合成音声システムや文字入力システムがどのように開発されたのか、という物語が公開されています。
Exclusive: Giving Stephen Hawking a voice (Wired UK)
http://www.wired.co.uk/magazine/archive/2015/01/features/giving-hawking-a-voice
学生時代にALSを発症したホーキング博士は、カスタマイズPCなどを使うことで研究を続けていますが、1985年に患った肺炎によって危篤状態になり、気管切開を行うための処置を受けました。その結果、一命は取り留めたものの声が出せなくなりました。話ができなくなったホーキング博士は、発声の代わりに、単語カードや眉の動きによって文字を入力するシステムを使うようになります。
ホーキング博士とともに最新の通信システムを開発している物理学者のマーティン・キング氏は、声を失った博士のためにコンピュータ入力補助ソフトウェアを提供しているWords Plusのウォルター・ウォルトスCEOに「イギリスでALSを患う大学教授を支援してくれないか」と依頼。ウォルトス氏は「教授とはスティーブン・ホーキング博士のことでしょうか」と尋ねましたが、名前を知ることはできなかったとのこと。
もともと、Words PlusのソフトはALSによって会話・書き取り能力を失った母親のために開発されたものであり、回答を求められたウォルトス氏は「必要なものは全て寄贈しましょう」と申し出を許諾しました。その結果、ホーキング博士の看護役兼エンジニアのデービッド・メーソン氏がWords Plusのシステムを元に車いすにマウントできるポータブル通信システムを完成させ、ホーキング博士は1分間に15語の速度で他人とコミュニケーションがとれるようになったとのこと。
By James Vaughan
車いすにマウントした通信システムは、手元のリモコンで親指を動かすことでコンピュータ言語やコマンドを選択および入力できますが、ホーキング博士の病状はゆっくりと進行しており、2008年には手の力が弱くなりすぎてリモコンを操作できなくなりました。このことから、メーソン氏はメガネのつるに取り付けた赤外線装置によって、頬の筋肉の緊張を検知する「頬スイッチ」と呼ばれるデバイスの開発に成功。それ以来、ホーキング博士は「メールの作成」「ブラウジング」「本の執筆」「合成音声による会話」といった作業を、手を使わずに頬の筋肉だけで行うことができるようになりました。
しかしながら、2011年までにホーキング博士の身体能力は低下を続け、頬スイッチを用いても1分間に1~2語までしか入力できなくなったとのこと。そのため、博士はインテルのムーア名誉会長に協力を依頼。これを受けたインテルはホーキング博士の新しいコミュニケーションシステムを開発するため、研究所の人員から5つのヒューマン・コンピュータ・インタラクション(HCI)の専門家チームを結成しました。
当時のホーキング博士のインターフェースはWords Plusの「EZキー」と呼ばれるプログラムを使用しており、「スクリーンキーボード」「基礎単語予測アルゴリズム」「マウスカーソル」といった機能を備えていました。初めてインテルのチームが博士と対談した時、博士は30単語のあいさつを述べるまでに30分を要しており、インテルのチームは「我々が考えていたよりもはるかに難しい問題であることを、その時理解しました」と話しています。
当初、インテルのチームは顔認識および視線追跡システム、ブレイン・マシン・インタフェースのような既存技術の応用を考えていましたが、どれもうまくいかなかったとのこと。
By Ars Electronica
インテルのチームは「ホーキング博士の詳細なフィードバックが必要」という結論に至り、数カ月で新しいインターフェースの試作品をホーキング博士に送りました。新型インターフェースを試してもらった結果、もともとかなり旧式のシステムを使っていたホーキング博士にとって、自動的に文章を予測して入力する最新の「単語予測アルゴリズム」や、文字を削除する「バックボタン」への操作機能の割当など、チームが「簡単な変更」と考えていたものは、博士にとっては「重大な変更」になってしまうことが判明。また、視線認識を使った文字入力システムでは、「完璧主義者」であるホーキング博士には耐えがたい「打ち間違い」がたびたび発生することもわかりました。
フィードバックを受けたチームは、携帯電話などで使われているような文字認識アルゴリズムによって、ホーキング博士の意図を1単語ごとに予測して選択できる機能を追加しました。2014年6月にホーキング博士はインテルの研究所を訪れてこのアルゴリズムに使ったところ、「素晴らしい改良です」と話していたとのこと。ただし、バックボタン1つで2つ以上の操作を可能にする機能には慣れることができず、廃止となりました。研究チームのデンマン氏は「彼は世界で最も賢い人間の1人ですが、iPhoneのような最新技術を使う機会がありません。我々は最新技術の使い方を世界で最も賢い72歳のおじいちゃんに教えようとしていたのです」と話しています。
By Epic Fireworks
ホーキング博士は新しいアルゴリズムの操作訓練を受け、さらなる改良がインターフェースに加えられたことで、文字の入力速度は上昇。さらにコンテキストメニューによって「話す」「検索」「メール」といったショートカットを選択できるようになり、合成音声によって話すための機能も改良されています。また、ホーキング博士はあごを横に動かすことができたため、あごに取り付けたジョイスティックによって車いすを自立操作できる可能性も出てきているとのこと。
なお、1988年にホーキング博士が合成音声ソフトのSpeech Plusを使った時、ホーキング博士は妻、娘、彼自身の声から合成音声の作成を依頼しており、女性音声の「Beautiful Betty」、子ども音声の「Kit the Kid」、男性音声の「Perfect Paul」が完成しています。ホーキング博士は今は発声できない自分の声に強い愛着を持っており、インテルの研究チームはデバイスの変更によって合成音声を変更する必要をなくすため、「Perfect Paul」のバックアップを見つけ出し、ホーキング博士自身の音声ソフトの開発に取り組んでいるとのことです。
・関連記事
Intelとスティーブン・ホーキング博士が開発した最新技術満載の「つながる車いす」とは? - GIGAZINE
スティーヴン・ホーキング博士のためにインテルが新たな入力方式を開発中 - GIGAZINE
Google・Apple・MS・FBのCEOやホリエモンなど、著名人が氷をかぶる謎のキャンペーンが実施中 - GIGAZINE
「脳神経インプラント」「集中スイッチ」、人間の脳を改良する未来技術とは? - GIGAZINE
脳波によって意思伝達を行う「ニューロコミュニケーター」が今夏製品化へ - GIGAZINE
人間の記憶を保存できるデバイスを脳に移植して失われた記憶力を補完する研究が進行中 - GIGAZINE
・関連コンテンツ