2023年02月15日

Spotify傘下のオーディオブック企業が「機械学習のトレーニングに音声データを提供する」条項を使ってAppleのAIナレーター作成に協力していたことが明らかに



Appleは独自の電子書籍アプリである「Apple Books(ブック)」に、人工知能(AI)による読み上げ機能を追加しています。このAIナレーション機能の開発には、実際のナレーターの音声データがいつの間にか使用されていたことが明らかになりました。音声データを提供していたのはSpotify傘下のオーディオブック企業です。



2023年1月初旬、AppleはブックアプリにAIによる読み上げ機能である「AIナレーション」を実装しました。



実際にブックアプリで「AI narration」と検索すると、以下の通り複数の候補が表示されます。





これらのオーディオブックには、「Apple Booksによるナレーション」という文字があります。これをタップ。





すると、「このオーディオブックは人が話すナレーションから合成されたデジタル音声(Madison)で楽しめます」と表示され、AIによる合成音声によるオーディオブックであることがわかります。





オーディオブックの画面下部にある「ナレーター」という項目に「Apple Books」と表記されているものは、合成音声によるナレーションが追加されているわけです。





AIによる合成音声を用いてオーディオブックを作成するとなると、これまでオーディオブックの読み上げを担当してきた俳優や声優の仕事がなくなるということで、一部の関係者からは批判の声が上がっていました。



一方でAppleは、「ますます多くの愛読家がオーディオブックを聴くようになっていますが、オーディオブックに対応している本はごく一部のみで、何百万冊もの本が非対応のままです。多くの著者、特に独立系の著者や小規模な出版社に関連する著者は、制作コストの高さと複雑さからオーディオブックを作成することができません。Apple Booksのデジタルナレーションにより、すべての人が手軽にオーディオブックを作成できるようになります。リスナーがより多くの本でオーディオブック機能を利用できるようになることで、高まる需要に応えることも可能となります。デジタルナレーションはプロが読み上げたオーディオブックを補完する貴重なツールであり、できるだけ多くの本とできるだけ多くのユーザーにオーディオブックを提供する役に立ちます」と述べ、合成音声をナレーションに使用することの利点を力説しています。





これまではAppleがどのようにしてSiriよりもはるかに流ちょうに話す合成音声を作成したのかは不明でしたが、WIREDによると2022年6月にSpotifyに買収されたFindawayと呼ばれるオーディオブック作成企業が、Appleに音声を提供してAIによる合成音声の作成に協力していたことが明らかになっています。



Findawayはナレーター業を務める俳優と契約する際に、「オーディオブックファイルを機械学習のトレーニングに使用する権利を与える」という条項を設けており、この条項をベースにAppleに音声ファイルを提供していた模様。実際にナレーターとしてFindawayと契約してオーディオブックの作成に取り組んだことがあるというアンディ・ガルシア・ルセ氏は、「我々の代わりになることを目的とした何かをトレーニングするために我々の声を使用するというのはおかしなことのように思えます」とコメントしています。Findawayで働いていた俳優によると、この条項がいつ頃追加されたかは不明だそうですが、契約時にこの条項について説明されなかった人もいるそうです。





これに対して、俳優関連のアメリカの労働組合である「SAG-AFTRA」が、Findawayに対して苦情を申し立てた模様。Findaway、Spotify、Appleの3社はどれも公にコメントしていませんが、SAG-AFTRAは会員に向けたメールの中で「機械学習目的でのファイルの使用を直ちに停止することでAppleと同意に達した」と説明しています。使用停止となったのは「今回の慣行の開始から使用されていたファイルにまでさかのぼる」とのことです。ただし、記事作成時点でもAppleはオーディオブックのナレーションにAIによる合成音声を使用しています。



なお、SAG-AFTRAのオーディオブック担当ナショナルディレクターを務めるジェーン・ラブ氏は、Findawayの音声データへのAppleからのアクセスが停止したことを確認しています。