OpenAIが著作権訴訟の証拠データを誤って消去していたことを明かす
OpenAIは、「生成AIモデルのトレーニングにコンテンツを利用した」と主張するアメリカの大手日刊紙「ニューヨーク・タイムズ」による著作権侵害に関する訴訟に直面しています。しかし2024年11月20日にOpenAIが裁判所に提出した書類の中でOpenAIは、この裁判に関する証拠のデータを誤ってすべて消去してしまったことを明かしています。
gov.uscourts.nysd.612697.328.1.pdf
(PDFファイル)https://docs.google.com/viewerng/viewer?url=https://storage.courtlistener.com/recap/gov.uscourts.nysd.612697/gov.uscourts.nysd.612697.328.1.pdf
gov.uscourts.nysd.612697.210.2.pdf
(PDFファイル)https://storage.courtlistener.com/recap/gov.uscourts.nysd.612697/gov.uscourts.nysd.612697.210.2.pdf
OpenAI accidentally deleted potential evidence in NY Times copyright lawsuit | TechCrunch
https://techcrunch.com/2024/11/20/openai-accidentally-deleted-potential-evidence-in-ny-times-copyright-lawsuit/
OpenAI accidentally erases potential evidence in training data lawsuit - The Verge
https://www.theverge.com/2024/11/21/24302606/openai-erases-evidence-in-training-data-lawsuit
ニューヨーク・タイムズは2023年12月に「ChatGPTやCopilotといった生成AIのベースとなる大規模言語モデルはニューヨーク・タイムズのコンテンツをトレーニングに利用しており、ニューヨーク・タイムズの表現スタイルを模倣した出力が可能になり、ニューヨーク・タイムズと直接競合するコンテンツを生み出すようになっている」「この結果ニューヨーク・タイムズのと読者の関係が損なわれ、購読料・ライセンス料・広告収益・アフィリエイト収入といった収入源が奪われただけでなく、質の高いジャーナリズムの提供を脅かしている」として、OpenAIとMicrosoftを著作権侵害で訴えました。
大手日刊紙のニューヨーク・タイムズがOpenAIとMicrosoftを著作権侵害で提訴 - GIGAZINE
ニューヨーク・タイムズとの裁判が続く中でOpenAIは、AIトレーニングセットに含まれる著作権で保護されたコンテンツを検索できる2台の仮想マシンをニューヨーク・タイムズ側に提供しています。OpenAIによると、2024年11月1日以降、ニューヨーク・タイムズの弁護士は専門家と共に150時間以上を費やしてトレーニングデータの検索を実施しているとのこと。
しかし、OpenAIは2024年11月20日にニューヨーク南部地区地方裁判所に提出した書類の中で「自社のエンジニアが2024年11月14日に、仮想マシンの1つに保存されているニューヨーク・タイムズによる検索データをすべて消去してしまった」と報告しました。
OpenAIはただちにデータの復旧を行いましたが、回収できたデータにはフォルダ構造とファイル名に深刻な問題が発生していました。OpenAIは「復旧したデータでは、ニューヨーク・タイムズの記事がOpenAIのAIモデルの構築にどのように使用されたかを適切に把握することは困難です」と述べています。なお、OpenAIはアクシデントの発生原因や消去されたデータの詳細について明らかにしていません。
OpenAIはこのデータ消去について「不具合によるもの」と説明しており、ニューヨーク・タイムズも「削除を意図的なものと断定する証拠はありません」と語っています。それでもニューヨーク・タイムズは「回復できたデータはほとんど使用不能で、専門家と弁護士による1週間分の作業をやり直す必要があります。今回のデータ消去は、仕事をゼロから作り直すことに膨大な時間を使うことを余儀なくされるものです」と批判しています。
なお、記事作成時点でOpenAIの広報担当者はコメントを残していません。
・関連記事
大手日刊紙のニューヨーク・タイムズがOpenAIとMicrosoftを著作権侵害で提訴 - GIGAZINE
報道機関によるOpenAIへの著作権訴訟が棄却される - GIGAZINE
ウォール・ストリート・ジャーナルの親会社がAI検索サービス「Perplexity」を著作権違反で訴える、Perplexityはライセンス契約の提案を無視 - GIGAZINE
OpenAIの著作権訴訟でChatGPTのトレーニングデータが一部の人間に開示されることが決定、オフライン・記録機器持ち込み禁止の厳重警備体制 - GIGAZINE
俳優労働組合SAG-AFTRAや世界最大の出版社が「AIをトレーニングするためにクリエイティブ作品を無許可で使用してはならない」とする公開書簡に署名 - GIGAZINE
ニューヨーク・タイムズがAIスタートアップのPerplexityにコンテンツへのアクセスと利用を停止することを要求 - GIGAZINE
・関連コンテンツ