2023年07月19日 12時20分 ネットサービス

8500人超の作家が「AIのトレーニングに人間の作品を無断使用するな」とOpenAIやMetaなどのAI開発企業に求める公開書簡に署名



生成AIのトレーニングに作家の著作が無断で使用されているとして、全米作家協会が「AIトレーニングに著作権で保護された素材を無断で使用するな」とOpenAIやAlphabet、MetaなどのAI開発企業へ訴える公開書簡を発表しました。この公開書簡には「ハンガー・ゲーム」シリーズで知られるスーザン・コリンズ氏、カナダを代表する作家であり2019年に「誓願」でブッカー賞を受賞したマーガレット・アトウッド氏など、8500人を超える作家が署名しています。



Open Letter to Generative AI Leaders

https://actionnetwork.org/petitions/authors-guild-open-letter-to-generative-ai-leaders





Nora Roberts, Margaret Atwood sign Authors Guild letter to fight AI : NPR

https://www.npr.org/2023/07/17/1187523435/thousands-of-authors-urge-ai-companies-to-stop-using-work-without-permission



Authors Guild begs OpenAI, Alphabet, Meta for fair pay • The Register

https://www.theregister.com/2023/07/18/ai_in_brief/



Thousands of authors sign letter urging AI makers to stop stealing books | TechCrunch

https://techcrunch.com/2023/07/18/thousands-of-authors-sign-letter-urging-ai-makers-to-stop-stealing-books/



OpenAIのChatGPTやMetaのLLaMAといった最先端のAIを使用すれば、文章を書いた経験がない人でもプロのような文章を生成することが可能であり、「○○のような文章を書いて」と指示することもできます。これらのAIを構築するため、AI開発企業は主にインターネット上から収集した膨大なトレーニングデータを使用していますが、その中にはインターネット上で違法に流通している著作権で保護されたコンテンツも含まれていると指摘されています。





新たに2023年7月、著作権の保護や著作家の経済的地位向上を目的とした業界団体の全米作家協会が、AIのトレーニングに著作権で保護されたコンテンツを用いることについての公開書簡を、さまざまなAI開発企業のリーダーたちに宛てて発表しました。宛先はOpenAIのサム・アルトマンCEO、AlphabetおよびGoogleのスンダー・ピチャイCEO、Metaのマーク・ザッカーバーグCEO、Stability AIのエマド・モスタクCEO、IBMのアービンド・クリシュナCEO、Microsoftのサティア・ナデラCEOとなっています。



全米作家協会は公開書簡の中で、大規模言語モデルに基づいて構築された生成AIはさまざまな作家が書いた物語や文体、アイデアを模倣して文章を生成するものであると指摘。これらのトレーニングには著作権で保護された大量の書籍・記事・エッセイ・詩などが「費用のかからない無限の食料」として使用されており、これらの著作がなければAIは平凡で非常に限定的な機能しか持たないと主張しています。



テクノロジー系メディアのTechCrunchは、「AI開発企業は書店やレビューから収集したサンプルによってトレーニングされているのでしょうか?それとも、図書館ですべての本を借りたのでしょうか?あるいは、Libgenのような違法なアーカイブをダウンロードしたのでしょうか?1つ確実に言えることは、彼らは出版社から正式なライセンス供与を受けなかったということです。ライセンスの供与を受けることこそ推奨される方法であり、唯一の法的かつ倫理的な方法です」と述べています。





AI開発企業はトレーニングデータの使用がフェアユースに該当すると説明していますが、全米作家協会は、芸術家のアンディ・ウォーホルがリン・ゴールドスミスの写真を使用した「プリンス・シリーズ」を巡る最高裁判所の判決でも商業性が問題視されたように、開発されたAIは高い商業性を有しておりフェアユースに反していると主張しています。また、「違法に収集された作品のコピーをフェアユースとして許す裁判所はありません」と述べ、現状のAI開発には問題があると訴えました。



全米作家協会によると、作家の収入は2009年から2019年にかけて42%も減少しており、フルタイムの作家の年収中央値は2022年の時点で2万3000ドル(約320万円)ほどだとのこと。出版業界に厳しい風が吹く中、著者の同意や使用に対する補償もなく開発されたAIが作家たちにさらなる悪影響をもたらす可能性があると、全米作家協会は指摘しています。



公開書簡の中で、全米作家協会はAI開発企業のリーダーたちに以下のようなステップを踏むことを求めています。



1:生成AIに著作権で保護されたコンテンツを使用する際には、正式な許可を取得すること。

2:生成AIにおける過去および現在の著作物の使用について、作家に対して公正な補償をすること。

3:現行の法に違反しているかどうかにかかわらず、AIの出力における著作物の使用について作家に公正な補償をすること。



全米作家協会のメアリー・ラセンバーガーCEOは、「公開書簡には、許可や対価の支払いなしにAIが私たちの著作を使用することは公正でないと書かれています。ですから、AI開発企業は私たちに補償を行い、対話を始めてください」と訴えています。ラセンバーガー氏によると、全米作家協会はAI開発企業に対して訴訟を起こそうとしているのではなく、和解させることが目的だとのこと。「訴訟は膨大な金額になり、長い時間もかかります」とラセンバーガー氏は述べました。



しかし、すでに一部の作家たちはAI開発企業に対して「著作権で保護されている作品の海賊版を入手し、トレーニングに利用した」として訴訟を起こしています。ニューヨークの文芸エージェントであるジーナ・マッコビー氏は、法的措置は作家に公正な補償を与えるために必要なステップだと主張しています。



OpenAIとMetaが著作権侵害で3人の作家から訴えられる - GIGAZINE





こうした流れに対し、AI開発企業もトレーニングデータの透明性を確保する動きを進めています。OpenAIは7月に、フォトストックサービスのShutterstockとの提携範囲を拡大し、画像・映像・音楽ライブラリおよび関連メタデータを含むトレーニングデータにアクセスするライセンスを得たことを発表。さらに、アメリカの非営利通信社であるAP通信とも提携し、過去記事へのアクセス権を入手したと報告しています。



OpenAIがShutterstockとの提携範囲を拡大し画像・映像・音楽・メタデータへのアクセス可能に - GIGAZINE