メモ

AIトレーニング会社は作家や詩人を雇いトレーニング素材となるオリジナル短編を書かせている


AIトレーニング会社として知られるScale AIAppenなどが、AIによるライティングの質を高めるために作家や詩人を雇って、トレーニングに用いるためのオリジナル短編を書くよう求めていることがわかりました。

AI data training companies like Scale AI are hiring poets - Rest of World
https://restofworld.org/2023/ai-developers-fiction-poetry-scale-ai-appen/


IT系ニュースサイトのRest of Worldによると、Scale AIやAppenといったAIトレーニングに従事する企業から、博士号や修士号を持つ作家、脚本家、詩人の求人が出ているとのこと。中には、アノテーターや文学分野での実務経験がある人文学の学位保持者を求める求人もあります。また、英語だけではなく、日本語やヒンディー語を対象とした求人も出ているそうです。

こうした求人で集められた人材に求められるのは、与えられたトピックに関するオリジナルの短編小説を執筆することで、執筆データはAIのトレーニングに利用されます。また、生成されたテキストの品質に関わるフィードバックの提供も求められるとのこと。


文章生成AIは詩も書けるとして人々に驚きを与えましたが、トレーニングを手がける企業は、その能力を他言語に拡張するためのデータサンプルの収集を開始しています。これは、AIの開発者がライティング性能の改良を行う一方で、詩的表現の流暢さを優先事項に掲げているからだと、Rest of Worldは指摘しています。

人間と見分けがつかないほど自然な文章を書けるAI「GPT-3」の改良版AI「InstructGPT」一般公開、詩も執筆可能 - GIGAZINE


Rest of Worldの取材を受けたウォータールー大学のダン・ブラウン教授は「タブロイド紙の見出しをフランス語で適切に作れるかどうかはわかりませんが、ヴィクトル・ユーゴーなどの文豪のスタイルを再現した文章が生成できるなら、それは別の信頼性を生みます」と述べ、この種の投資は利益を生む可能性があると認めました。

AppenはRest of Worldに対して、2022年以降に英語以外の言語を含めた執筆請負業者の需要が高まっていることを認め、採用している人材は詩や歌詞、物語など、クリエイティブなAIを作るための高品質なトレーニングデータを生み出せる独自の専門知識を持っていると述べました。

一方でScale AIは、「安全で正確なAIの開発のためには人間が不可欠なので、今後も私たちの仕事には人間が関与し続けるでしょう」と述べたものの、競争上の理由から、採用活動に関する具体的な回答は拒否したとのこと。

初期の文章生成AIは経済ニュースやスポーツ記事の執筆を行いましたが、これは定型的な内容で作れてオリジナリティを求められないためです。詩的文章の生成を求められると、文章生成AIはアメリカを代表する詩人であるウォルト・ホイットマンの「構造化されていない」というスタイルすらほぼまねることができず、定型の詩を生成してしまいます。英語以外の言語だと状況はさらに悪くなります。


このギャップを埋めるために、AppenやScale AIのクライアントはクリエイティブな請負業者にかなりの報酬を出しているとのこと。たとえば、Scale AIの日本語の一般的なデータワーカーは時給13.98ドル(約2100円)ですが、専門知識がある業者には時給50ドル(約7400円)と、2倍以上の賃金を支払っています。

イェール大学のジュリアン・ポサダ准教授は、クリエイターがこの種の仕事を持続可能な雇用形態だとして受け入れるかどうかは疑問だとしつつも、AIトレーニング会社にとってはクリエイティブ産業によるAI批判の主要な声である著作権侵害の申し立てを回避する手になると述べました。

8500人超の作家が「AIのトレーニングに人間の作品を無断使用するな」とOpenAIやMetaなどのAI開発企業に求める公開書簡に署名 - GIGAZINE


ポサダ准教授は、今後、状況は著作権で保護された素材をトレーニングに使えなくなるところまで至る可能性があり、そうなると「トレーニングのためにクリエイティブな文章を購入する」ことになっていくとの見方を示しています。

この記事のタイトルとURLをコピーする

・関連記事
MicrosoftがAIサービスを使った顧客の著作権侵害の訴訟結果はMicrosoftが引き受けるという声明を発表 - GIGAZINE

「ChatGPTの学習に海賊版の本が使われた」として作家がOpenAIを告訴 - GIGAZINE

画像生成AIによる作品の無許可使用を主張した写真家が逆に損害賠償を請求される - GIGAZINE

画像生成AIの著作権問題について海外や日本ではどのように解釈されているのか? - GIGAZINE

ニューヨーク・タイムズがAI学習のための記事利用を原則禁止に、OpenAIに対しては法的措置を検討 - GIGAZINE

「AIのトレーニングに楽曲が使用されるのを阻止してほしい」とユニバーサルミュージックグループがSpotifyやApple Musicに要求 - GIGAZINE

「日本はAI技術の開発に全力を尽くそうとしている」という指摘、日本は何が違うのか? - GIGAZINE

「AIが生成した作品は著作権で保護される余地がない」との判決が下る - GIGAZINE

in メモ, Posted by logc_nt

You can read the machine translated English article here.