ソフトウェア

コード補完AI「GitHub Copilot」の集団訴訟をソフトウェアの知的財産権に詳しい弁護士はどう見ているのか?


2022年11月、GitHubのコードで学習したコード補完AIサービス「GitHub Copilot」の開発に携わったGitHub・Microsoft・OpenAIの3社を相手に集団訴訟が提起されました。この訴訟におけるポイントや原告側の勝算について、ソフトウェアテクノロジー業界の知的財産権を専門にするケイト・ダウニング弁護士が解説しています。

AN Open Source Lawyer’s View on the Copilot Class Action Lawsuit – Law Offices of Kate Downing
https://katedowninglaw.com/2022/11/10/open-source-lawyers-view-on-the-copilot-class-action-lawsuit/

GitHub Copilotは、ソフトウェア開発プラットフォームのGitHubを所有するMicrosoftと人工知能開発組織のOpenAIが共同開発したAIサービスで、途中まで書いたコードを補完したり、コメントに応じてコードを書いたりすることが可能です。ところが、GitHub CopilotのトレーニングにはGitHubの公開リポジトリが利用されており、以前から「著作権で保護されたコードを出力する」という指摘や、「オープンソースコミュニティを破壊する」という懸念の声も上がっています。

そして11月3日、カリフォルニア州とニューヨーク州にオフィスを構えるJoseph Saveri法律事務所が主導し、カリフォルニア州北部地区連邦地方裁判所に集団訴訟が提起されました。AIが学習したものを生成するサービスにまつわる訴訟は、これが初とされています。

ついにGitHubのコードで学習したAI「GitHub Copilot」が集団訴訟に直面 - GIGAZINE


この集団訴訟について、オープンソースソフトウェアに関する知的財産権を専門とするダウニング氏が解説しています。ダウニング氏によると、今回の訴状において原告側が請求している項目は以下の通り。

・個々のGitHubリポジトリのオープンソースライセンスに関連する契約違反(著作権の侵害ではない)
・契約関係に対する不法な妨害(GitHub Copilotユーザーがオープンソースライセンス契約を順守できるよう、適切なライセンス情報を提供しなかったことによる)
・詐欺(GitHubのコードがGitHub外部で利用されないとする利用規約およびプライバシーポリシーに関連する)
・連邦商標法に基づくリバースパッシングオフ(GitHub Copilotのユーザーに対し、出力されるコードはGitHub Copilot自身が生成すると信じ込ませたことによる)
不当利得
・反競争的行為
・GitHubの利用規約およびプライバシーポリシーの個人データ取り扱いに関連する契約違反
・個人データに関するカリフォルニア州消費者プライバシー法(CCPA)違反
・個人データ取り扱いに関する過失
民事共謀

ここでダウニング氏が「魅力的」だと評しているのが、「原告側は著作権侵害について主張していない」という点です。AIと著作権を巡る議論では、「AIのトレーニングに著作権のあるコンテンツを利用することはフェアユースに当たる」という主張が頻繁に持ち出されますが、原告側はこの抗弁を事前に予想して著作権侵害についての議論を回避しようと試みているとのこと。

また、今回の訴訟はGitHubユーザーを原告とする集団訴訟ですが、GitHubにコードを公開しているほとんどの人は、自分のコードを著作物として正式に登録していません。そのため、著作権侵害についての申し立てを行おうとすると、登録された著作権を持つ原告を見つける必要があるため、原告の人数が99%以上減ってしまうと予想されます。加えて、著作権侵害についての主張を避けることで、機械学習と著作権に関する最終的な判例となるのを避けることができるとダウニング氏は考えています。


ダウニング氏は、原告側が著作権侵害を回避した主張を展開したことを興味深いと評する一方で、GitHubの利用規約を読み違えているように見えると指摘。利用規約では、GitHubのユーザーは「サービス」を実行および改善するためにコンテンツを使用する権利をGitHubに付与しており、GitHub Copilotにコードを使用すること自体は問題ないとのこと。

また、短いコード行では著作権による保護の対象とならず、帰属情報の提示についての主張も適用されない可能性が高いほか、個人データに関する申し立ても難しいとダウニング氏は考えているそうです。


そしてダウニング氏は、今回の訴訟によってGitHub Copilotがすべての提案についてライセンス情報を提示するように強制されたとしても、それが開発者にとっての利益になるのかどうか疑問だという点も指摘しています。加えて、GitHub Copilotの提案は複数のソースに由来する可能性が高く、そのうちどのソースを帰属として表示するべきなのか、あるいはすべてのソースについて帰属を表示するべきなのかという問題もあるとのこと。

ダウニング氏は、GitHub Copilotは学習データから元のコードを正確に再生成する確率は1%だと説明しており、このうち著作権で保護されない部分を考慮すれば、原告が求める帰属表示は提案の1%未満であると主張。「確かに、影響を受ける著作権所有者には権利がありますが、これは『インパクトのある訴訟』ではありません。もし、非常に便利で生産性を向上させる技術が、意味のない帰属表示の欠如を理由に支払いを求める人々に妨害されているとしたら、それはトロールのように見えます」と述べました。

この記事のタイトルとURLをコピーする

・関連記事
ついにGitHubのコードで学習したAI「GitHub Copilot」が集団訴訟に直面 - GIGAZINE

コード補完AIのGitHub Copilotは著作権問題に加え「オープンソースコミュニティを破壊する危険性」がある - GIGAZINE

ソースコードの続きを自動補完するGitHub Copilotに「著作権で保護されたコードを出力している」という指摘が寄せられる - GIGAZINE

コード自動入力AI「GitHub Copilot」は「開発者のコードを勝手に売りさばくサービス」という指摘 - GIGAZINE

ソースコードの「続き」を自動で補完する「GitHub Copilot」がすべてのユーザーに利用可能へ - GIGAZINE

「AIが作った芸術作品に著作権はない」とアメリカ著作権局がAIの著作権を拒否 - GIGAZINE

「AIを発明者とは認めない」という判決がアメリカで下る、他方オーストラリアは「認める」 - GIGAZINE

in ソフトウェア,   ネットサービス, Posted by log1h_ik

You can read the machine translated English article here.