ソフトウェア

GitHubのソースコードで学習したプログラミングAI「Copilot」は著作権侵害なのか?


ソフトウェア開発プラットフォームのGitHubが2021年6月に、ソースコードを書くとその続きを補完する機能である「GitHub Copilot」をリリースしました。Microsoft傘下のGitHubが、ライセンスを問わずGitHub上のあらゆるソースコードを学習して作られたCopilotを商業利用することについて、「著作権的に問題があるのではないか?」との議論が巻き起こっています。

Julia Reda – GitHub Copilot is not infringing your copyright
https://juliareda.eu/2021/07/github-copilot-is-not-infringing-your-copyright/

GitHubが、人工知能研究組織のOpenAIと協力してリリースしたCopilotは、途中まで記述したソースコードの「続き」を自動で補完する機能です。どのような機能なのかは、以下の記事に詳しくまとめられています。

GitHubにソースコードの「続き」を自動で補完する機能「GitHub Copilot」が登場、OpenAIの協力により - GIGAZINE


「物議を醸した文章作成AIのGPT-3よりはるかに優れている」との評もあるCopilotをめぐっては、「エンジニアを駆逐してしまうのか?」という議論もなされています。

プログラマーの書いたソースコードの続きを自動で記述する「GitHub Copilot」はエンジニアを駆逐してしまうのか? - GIGAZINE


そんな中、ソフトウェア開発者のNora Tindall氏はTwitterで、CopilotについてのGitHubとのやりとりを公開しました。GitHubへの問い合わせの中で「私のGitHubアカウントのコードはCopilotのトレーニングに使われましたか?」と尋ねたTindall氏に対し、GitHubは「GitHubで公開されているコードがすべてトレーニングに使われているようです。私たちはライセンスの種類でコードを区別しませんでした」と回答。これに対し、Tindall氏は「なんてことでしょう。彼らは文字通り恥を知りません」と非難しています。

oh my gods. they literally have no shame about this.

GitHub Support just straight up confirmed in an email that yes, they used all public GitHub code, for Codex/Copilot regardless of license. pic.twitter.com/pFTqbvnTEK

— ✨ Nora Tindall ???? (@NoraDotCodes)


GitHubがユーザーの著作権を尊重せず、コードを無断でAIの学習に使用したことに納得できないTindall氏は、「フリーソフトウェア財団電子フロンティア財団の法務部に連絡しました。集団訴訟への参加に興味のある方も連絡をお願いします。ひとりでは何もできません」と述べて、法的な措置も辞さない姿勢をあらわにしました。

I've reached out to @fsf and @EFF's legal teams regarding this. Please also reach out if you would be interested in participating in a class action. No one person can do this alone.

— ✨ Nora Tindall ???? (@NoraDotCodes)


GitHubとのやりとりを報告したTindall氏のツイートには、記事作成時点で4000件以上の「いいね」が寄せられています。また、ツイートが取り上げられたオンライン掲示板・Hacker Newsのスレッドには「学習データにGPLライセンスのコードが含まれているのなら、CopilotもGPLに基づいて配布されるべきなのではないでしょうか。中には人間がコードを読んで勉強するのとどう違うのかという人もいますが、AIと人間とは大きく違います。人間はコピーして配布されるものではありません」というコメントや、「ツイートが注目を集める前は、プログラマーが短いコードをコピーすることに関心を寄せるのは弁護士や経営者だけでした。それが突然、誰もが著作権の最大化を主張するようになったのはどういう風の吹き回しですか?」といったコメントをはじめとする多数の書き込みが投稿され、議論が紛糾しました。

こうした議論について、欧州海賊党に所属する欧州議会議員であるジュリア・レダ氏は、「大企業、つまりGitHubの親会社であるMicrosoftがフリーソフトを分析して利益を得ようとしているのですから、著作権を使ってそれを阻止しようとするのはコピーレフトの擁護者にとっては当然のことだと思えるかもしれません」と述べて、コードの再配布や改変を認めるコピーレフトの考え方が大企業に利用されることへの拒否感に理解を示しています。


その一方で、レダ氏は「EUの著作権法では、GPLでライセンスされたコードやその他の著作物のスクレイピングは、ライセンスにかかわらず合法です。またアメリカでも、スクレイピングはフェアユースに該当します」と述べて、AIのトレーニングのためのコードをデータマイニングしても、著作権法に抵触するコピーには該当しないと指摘しました。またCopilotが生成するコードも、オリジナルのコードの独自性が認められるような性質のものではないため、著作権法で規定されている二次的著作物には当たらないと、レダ氏は結論づけました。

この記事のタイトルとURLをコピーする

・関連記事
プログラマーの書いたソースコードの続きを自動で記述する「GitHub Copilot」はエンジニアを駆逐してしまうのか? - GIGAZINE

GitHubにソースコードの「続き」を自動で補完する機能「GitHub Copilot」が登場、OpenAIの協力により - GIGAZINE

GitHubがTorrent共有サイト「Nyaa.si」のリポジトリを復活 - GIGAZINE

「GitHubに削除されたYouTube動画ダウンローダーは著作権侵害用ツールではない」とオープンソース団体やジャーナリストが反発 - GIGAZINE

in ソフトウェア, Posted by log1l_ks

You can read the machine translated English article here.