ネットサービス

ChatGPTの学習にウォール・ストリート・ジャーナルやCNNなどの記事が許可なく使われていると報じられる


AI研究団体・OpenAIが開発した対話型チャットAIのChatGPTは、人間からの質問に対して非常に自然に受け答えできるだけでなく、プログラムの作成判決文の作成などに活用されています。しかしChatGPTの機械学習に複数のニュースメディアの記事が許可なく使用されていることがジャーナリストのフランチェスコ・マルコーニ氏によって指摘されています。

OpenAI's ChatGPT Criticized by News Media for Using Articles to Train Bot - Bloomberg
https://www.bloomberg.com/news/articles/2023-02-17/openai-is-faulted-by-media-for-using-articles-to-train-chatgpt

2023年2月15日、マルコーニ氏はChatGPTに対して、「Which specific news sources was chatGPT trained on? Provide a list of the top news sources in your database.(ChatGPTは具体的にどのようなニュースソースで学習したのですか。データベース内のニュースソースのリストを提示してください)」と尋ねました。

Here’s the prompt I used: "Which specific news sources was chatGPT trained on? Provide a list of the top news sources in your database."

— Francesco Marconi (@fpmarconi)


するとChatGPTは以下の20社のニュースメディアを提示しました。

・ロイター
・ニューヨーク・タイムズ
・The Guardian
・BBC News
・ウォール・ストリート・ジャーナル
・CNN
・アルジャジーラ
・ワシントン・ポスト
・AP通信
・Bloomberg
・Financial Times
・The Economist
・National Public Radio
・The Atlantic
・Scientific American
・TechCrunch
・Wired
・Fortune
・Forbes
・Business Insider

マルコーニ氏は「OpenAIがこれらすべてのニュースメディアと契約を結んでいるかどうかは不明です。企業の許可なくデータの学習を行なうと、パブリッシャーの利用規約に違反することになります」と指摘しています。

ChatGPT is trained on a large amount of news data from top sources that fuel its AI. It's unclear whether OpenAI has agreements with all of these publishers. Scraping data without permission would break the publishers' terms of service. pic.twitter.com/RXEjMHWXiI

— Francesco Marconi (@fpmarconi)


ウォール・ストリート・ジャーナルの親会社ダウ・ジョーンズのジェイソン・コンティ氏は「ウォールストリートジャーナルの記事を利用してAIの学習を行ないたい場合、ダウ・ジョーンズから適切なライセンスを得る必要があります」「ダウ・ジョーンズはOpenAIとそのような契約を結んでいません」と述べています。

“Anyone who wants to use the work of Wall Street Journal journalists to train artificial intelligence should be properly licensing the rights to do so from Dow Jones,” Jason Conti, general counsel for News $NWSA Dow Jones unit

“Dow Jones does not have such a deal with OpenAI”

— StockMKTNewz - Evan (@StockMKTNewz)


また、コンティ氏は「我々はジャーナリストの仕事を悪用して機械学習を行なうことについて深刻に受け止めており、OpenAIへの対応を検討しています」と付け加えました。


この件に詳しい匿名の関係者は、この問題を報じたBloombergに「無許可で記事を使用してChatGPTの学習を行なうことは、CNNの利用規約に違反すると捉えています、CNNの親会社であるワーナー・ブラザース・ディスカバリーはOpenAIに対して適切なライセンス料を支払うことを要求する予定です」と語っています。

AIの学習に許可なくコンテンツが使用されている問題はChatGPTが初めてではなく、これまでにコード補完サービス「GitHub Copilot」や画像生成AI「Stable Diffusion」や「Midjourney」に対して、著作権保護の観点から集団訴訟が提起されています。

記事作成時点でOpenAIはこの指摘に対するコメントを発表していません。

この記事のタイトルとURLをコピーする

・関連記事
Microsoft、GitHub、OpenAIが「AIツールによる著作権侵害訴訟」の棄却を裁判所に要請 - GIGAZINE

OpenAI開発のテキスト生成AI「GPT-3」がどんな処理を行っているのかを専門家が解説 - GIGAZINE

「ChatGPTを改善するためにOpenAIが時給300円以下でケニア人を雇った」と問題視する報道 - GIGAZINE

画像生成AI「Stable Diffusion」と「Midjourney」に対して集団訴訟が提起される - GIGAZINE

ついにGitHubのコードで学習したAI「GitHub Copilot」が集団訴訟に直面 - GIGAZINE

in ネットサービス, Posted by log1r_ut

You can read the machine translated English article here.