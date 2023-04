2023年04月28日 13時00分 ソフトウェア

AI学習データの開示を義務づける法案がEUで提出される



AIの学習データ開示を企業に義務づける法案がEUで提出され、成立に向けて一歩前進したことが明らかになりました。



新しい法案によると、文章生成AIのChatGPTや画像生成AIのStable Diffusion、Midjourneyなどを展開している企業に対し、システムの開発に使用した学習データをまとめ、データの詳細を開示する義務が課せられるとのこと。





AIは世間にあふれる何十億もの文章、画像、動画を学習することで高精度なコンテンツを生み出せているのですが、学習に使われたデータの中に著作権で保護されたコンテンツが含まれている可能性があることもたびたび指摘されています。



EUはこうした状況を鑑み、2021年に起草されたAI法案に学習データの開示を義務づける条項を盛り込みました。この法案が2023年4月に入り改めて検討され、成立に向けて次の段階へ進むことが決まりました。



この法案が可決されると、自分たちのコンテンツがどの程度学習されたのかを把握したいクリエイターにとって追い風になります。著作権で保護されたコンテンツが学習されたことが分かった場合、著作者が利益の分配を求めたり、訴訟を起こしたりできるようになる可能性もあります。





一般データ保護規則(GDPR)の下で企業のデータ収集が厳しく規制されているEUでは、イタリアがChatGPTの利用を禁止し、ドイツやフランスがイタリアに追随する動きを見せています。



GDPRの下では、技術系企業が個人のデータを使って製品を訓練する際はユーザーの同意を得なければなりません。また、EUで事業を展開する企業は、データの収集と共有をEUの人々が拒否できるよう選択肢を与える必要があります。



ChatGPTを禁止したイタリアのデータ保護機関は、開発元のOpenAIに対し、2023年4月30日までにイタリア及びEUの法律を順守するよう求めています。しかし、AIの専門家は「OpenAIのモデルはインターネットからかき集めた大量の情報を元にトレーニングされているため、開発者でさえ、どのようなデータが収集されているかを正確に把握することはできないだろう」と指摘。OpenAIが要求に応えるのは不可能に近いと述べています。



新しい法案では、ChatGPTを含むすべての生成AIを管理する組織が規制の対象となるため、こうした組織はAIの運用について高い透明性を確保する必要があります。



ロイターによると、一部の委員会メンバーは当初、著作権で保護されたコンテンツを学習に使用することを完全に禁止することを提案しましたが、これは透明性の要件が支持されたために断念されたとのこと。欧州議会の副議長であるスヴェンジャ・ハーン氏は、「議会は、AIを比例的に規制し、市民の権利を守るとともに、イノベーションを促進して経済を活性化するための確固たる妥協点を見つけました」と述べました。