メモ

AIのトレーニングモデルを分析したら数千人の有名作家の本を含む約20万タイトルが確認されるも、トレーニングに使われたスティーヴン・キングは「AIを恐れていない」と発言


大規模言語モデル「LLaMA」のトレーニングにMetaが使用したことで知られる書籍のデータセット「Books3」は、AIモデルのトレーニング用に約19万6640冊、約37GBものデータを含んでおり、著作権侵害対策グループからの削除要請なども行われています。トレーニングデータには村上春樹氏の小説や「ホラーの帝王」と呼ばれるスティーヴン・キング氏の作品など有名作品も多く含まれていましたが、自身の作品がAIに使われていると知ったキング氏は、AIによる作品の使用を禁止するつもりはないとAIの脅威を恐れていない姿勢を語っています。

Stephen King: My Books Were Used to Train AI - The Atlantic
https://www.theatlantic.com/books/archive/2023/08/stephen-king-books-ai-writing/675088/


Stephen King Isn't Afraid of AI—His Books Have Trained It - Decrypt
https://decrypt.co/153807/stephen-king-isnt-afraid-ai-books-have-trained


アメリカのメディアであるThe AtlanticがBooks3のデータを分析したところ、Books3のトレーニングデータにはWikipediaなどのオンラインにある文章から引用したものの他、19万冊以上の書籍情報が確認できたとのこと。そのうち約2万冊は書籍データベースから特定できませんでしたが、約17万冊はタイトルや著者も特定することができています。特定できたタイトルの大半は過去20年以内に出版されたものであり、およそ3分の1がフィクションとなっています。


The Atlanticの分析結果を受け、Metaの広報担当者はBook3の使用についてコメントを控えました。一方でBloombergはBook3データセットの使用を認めた上で、「私たちは、BloombergGPTの将来のバージョンを訓練するために使用されるデータソースに、Books3データセットを含めません」とコメントしています。

IT」「シャイニング」「スタンド・バイ・ミー」「ショーシャンクの空に」などの作品の映像化がヒットしたことでも知られる小説家のスティーヴン・キング氏の複数作品も含まれていました。このことを受けてキング氏は、The AtlanticにAIに関する論説を投稿しています。

by Christchurch City Libraries

小説技法や自伝的内容をつづったノンフィクション「書くことについて」の中でキング氏は「たくさん本を読む読書家でなければ、書くことを学ぶことはできません」と述べています。これをふまえて、キング氏はThe Atlanticに掲載した論説の中で、「実際にAIはこれを実践し、大量の本を読み込んだ上でクオリティの高い文章を出力しようと試みていますが、結論として、それはうまくいっていないし、うまくいかないでしょう」と語っています。



キング氏は有名な詩人をマネして書かれたAIの詩を見たことがあると例に挙げ、「一見すると良くても、しっかり読み込むとそれほど良くない詩だと分かります」と述べています。キング氏の考えでは、創造性には「感性」が必要であり、AIが感性を実現すると主張する人もいるかもしれませんが、キング氏は依然として懐疑的な姿勢を見せています。

AIの実力について懐疑的であることに加えて、技術の発展は妨げられることはないという理由で、キング氏はAIのトレーニングに自身の作品が使われることに反発していません。キング氏は「私たちはさまざまな技術に囲まれて生きており、それらなしでは生きていけません。AIの発展も避けられないもので、それに抵抗するのは無駄だと感じます。AIの潜在的な知覚力には警戒心を持つ必要がありますが、自分の作品を禁止するのは、蒸気機関を打ち砕いて産業の進歩を止めようとするラッダイト運動のような無意味な妨害行為です」と語りました。

キング氏はAIを非難するのではなくAIがどこに向かうのかを前向きに見ており、「スマートフォンがほとんどの人の手元にあるように、社会はテクノロジーに適応して受け入れることができます」と述べています。

この記事のタイトルとURLをコピーする

・関連記事
Metaの大規模言語モデル「LLaMA」のトレーニングにも使用されたAIの学習用データセット「Books3」が削除される - GIGAZINE

独自の金融ビジネス特化型AI「BloombergGPT」をBloombergが発表、金融アナリストの業務や金融ニュースの作成を手助け可能 - GIGAZINE

8500人超の作家が「AIのトレーニングに人間の作品を無断使用するな」とOpenAIやMetaなどのAI開発企業に求める公開書簡に署名 - GIGAZINE

「ChatGPTの学習に海賊版の本が使われた」として作家がOpenAIを告訴 - GIGAZINE

OpenAIとMetaが著作権侵害で3人の作家から訴えられる - GIGAZINE

in メモ, Posted by log1e_dh

You can read the machine translated English article After analyzing the AI training model, a….