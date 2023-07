2023年07月10日 11時10分 ソフトウェア

OpenAIとMetaが著作権侵害で3人の作家から訴えられる



3人のアメリカ人作家が2023年7月7日に、OpenAIのChatGPTとMetaのLLaMAに著作権を侵害されたとして両社を提訴しました。原告らは、著作権で保護された自分たちの書籍が、両社のAIモデルのトレーニング教材として使用されることに同意していないと訴えています。



Sarah Silverman is suing OpenAI and Meta for copyright infringement - The Verge

https://www.theverge.com/2023/7/9/23788741/sarah-silverman-openai-meta-chatgpt-llama-copyright-infringement-chatbots-artificial-intelligence-ai





今回、OpenAIとMetaを訴えたのは、コメディアンで作家でもあるサラ・シルバーマン氏および作家のクリストファー・ゴールデン氏とリチャード・カドレー氏です。原告は、ChatGPTとLLaMAが違法にインターネット上に流通している作品をデータセットとしてトレーニングされたものであると主張しました。



原告は、ChatGPTやLLaMAに著作権を侵害された証拠として、これらの文章生成AIが自分たちの書籍を要約したことを証拠資料として提出しています。具体的には、シルバーマン氏の「Bedwetter」やゴールデン氏の「Aararat」、カドレー氏の「Sandman Slim」が挙げられています。



OpenAIに対する訴えの中で原告らは、これらの作品がTorrentのトラッカーサイト「Bibliotik」や違法コピーされた書籍のサーチエンジン「Library Genesis」、海賊版電子書籍データベース「Z-Library」など、いわゆる「影の図書館(シャドウライブラリ)」から入手されたもので、「書籍はTorrent経由で大量に入手できる」と指摘しています。





また、Metaに対する別の訴訟では、LLaMAの学習に使われたデータセットから著作権で保護された書籍にアクセスすることができたとされています。MetaはLLaMAについての詳細を論文で公開しており、出典としてトレーニング用データセットも明示していますが、そのうちのひとつに「ThePile」があります。ThePileを作成したAI研究者グループのEleutherAIは、論文の中で「ThePileはBibliotikのプライベートトラッカーのコンテンツのコピーから作成されたもの」と説明しており、Bibliotikを含むシャドウライブラリの利用は「明らかに違法である」と原告らは述べました。



3人の作家は、同意なく自分たちの書籍がトレーニング教材に使われているとして、OpenAIとMetaを著作権侵害、過失、不当利得など6つの訴因で起訴しており、両社に対して損害賠償と利益の返還を求めました。





作家が文章生成AIの開発企業を訴えたのはこれが初めてではありません。2023年6月28日には、作家のモナ・アワド氏とポール・トンブレイ氏が、同意なく作品をChatGPTのトレーニングに使用されたとして、著作権違反でOpenAIを訴えました。イギリスのニュースメディア・The Guardianによると、これはChatGPTが著作権に違反しているとしてOpenAIが訴えられた最初の事例とのこと。



「ChatGPTの学習に海賊版の本が使われた」として作家がOpenAIを告訴 - GIGAZINE





オーストラリア・ニューサウスウェールズ大学のAIおよび著作権法の研究者であるディラン・タンパピライ氏は、「原告はOpenAIが自分たちの作品をコピーし、それによって経済的存在が生じたことを証明する必要があります。作品をデータベースにコピーするのは侵害行為にあたると思われますが、その行為だけで著作権者の経済的利益に大きな損害が出る可能性は高くありません」と述べて、この訴訟は失敗に終わる可能性があると指摘しました。



文章生成AI以外では、画像生成AIのStable DiffusionとMidjourneyが、2023年1月に集団訴訟を起こされています。



画像生成AI「Stable Diffusion」と「Midjourney」に対して集団訴訟が提起される - GIGAZINE