ネットサービス

Discordから40億以上のメッセージを抜き出して有料で販売している「Spy.pet」の存在が明るみに


1万4000以上のDiscordチャットサーバーから、6億2000万人近くのユーザーがやりとりした40億件以上のメッセージを抜き出し、そのアクセス権を販売していると主張するサービス「Spy.pet」について、イギリスのニュースサイト・The Registerが報じました。

Site claims to have harvested 4B+ Discord chats, all on sale • The Register
https://www.theregister.com/2024/04/16/discord_network_sale/

伝えられるところによると、Spy.petがサービスを開始したのは2023年11月で、ユーザーの同意を得ているとは考えにくい形でDiscordサーバーとそのユーザーのアクティビティを抽出しているとのこと。

データの用途までは不明ですが、The Registerは「監視とまでは言わずとも、AIモデルの訓練などさまざまな目的のために、ボットを使ってこのようなチャットの収集が行われることもあり得るということを想起させます」と述べました。


Spy.petでは収集した一部データの内容が紹介されており、これにはユーザーのプロフィールやそこに含まれているニックネーム、代名詞、SteamやGitHubなどの他のプラットフォームと連携しているアカウント、参加したDiscordサーバー、公開メッセージが含まれています。

プライバシーデータの閲覧は有料で、会話のアーカイブにアクセスしたり、待ち時間なしでサーバーの検索をしたりするには、「クレジット」を購入する必要があります。1クレジットの価格は1セント(約1.5円)で、例えばプロフィールにアクセスするには10クレジットがかかるとのこと。なお、決済には仮想通貨しか使えません。


また、Spy.petの運営者に問い合わせできるオプションの「エンタープライズ」もあり、そこには「Discordのメッセージを使ったAIモデルのトレーニングに興味がおありですか?それとも、新しい情報源をお探しの連邦捜査官のグループですか?」との触れ込みが記載されていました。

Spy.petには、Coinbaseのリンク経由での寄付を受け付けていた形跡がありましたが、記事作成時点では機能していないとのこと。Spy.petの公式ブログの投稿から、これはCoinbaseがSpy.petを禁止したのが理由だろうとThe Registerは推測しています。

この投稿にはまた、Spy.petが2024年2月にDDoS攻撃を受けたものの、それをやり過ごすことに成功したことが書かれていました。「これらの攻撃はすべて、私個人にもウェブサイト全体にも最小限のダメージしか与えませんでした。この努力の結果、ダウンタイムはたったの50分でした」とSpy.petの運営者は記しています。


EU一般データ保護規則(GDPR)の第6条、第8条、第17条にはそれぞれ同意に基づくデータの追跡、未成年者のデータ追跡に関する保護者の同意、そして忘れられる権利についての条文があるため、The Registerは「Spy.petはGDPRの少なくとも3つの条文を見直した方がいいかもしれません」と指摘しています。

また、アメリカ当局も子どもの個人情報の取り扱いに厳しい目を注いでおり、2023年11月には連邦取引委員会(FTC)が子どものプライバシーをめぐってMetaに対する訴訟を起こしています。

The RegisterはSpy.petに問い合わせを行いましたが、記事作成時点のところ返答はないとのこと。一方、Discordは「利用規約とコミュニティガイドラインに違反する行為があったと判断した場合、ポリシーを執行するための適切な措置を取ります。目下のところ調査中であるため、これ以上のコメントは差し控えます」と回答しました。

・つづき
6億人以上のDiscordユーザーをスパイしていた「Spy Pet」が閉鎖される、Discordは法的措置を検討 - GIGAZINE


◆フォーラム開設中
本記事に関連するフォーラムをGIGAZINE公式Discordサーバーに設置しました。誰でも自由に書き込めるので、どしどしコメントしてください!Discordアカウントを持っていない場合は、アカウント作成手順解説記事を参考にアカウントを作成してみてください!

• Discord | "Discordの会話履歴が勝手に売られてるけど、使い続ける?利用中止する?問題あり?なし?" | GIGAZINE(ギガジン)
https://discord.com/channels/1037961069903216680/1230106098627903549

この記事のタイトルとURLをコピーする

・関連記事
MetaがAI強化のため「訴えられてもいいから著作権で保護された作品をかき集めよう」と議論していたとの報道 - GIGAZINE

100万時間以上のYouTube動画をOpenAIがAIモデルのトレーニングに利用していたことが判明 - GIGAZINE

TumblrやWordPressがユーザーデータをAIトレーニングに提供する契約を結ぼうとしていたことが判明 - GIGAZINE

「オンラインで公開されたものすべてをAIのためにスクレイピングする」とGoogleが発表 - GIGAZINE

なぜ企業はユーザー行動のデータを収集したがるのかはネット上で人間を監視するボットの仕組みから理解できる - GIGAZINE

きちんとチェックすると「781年」かかるAI用データセット「LAION-5B」の課題がよくわかる「Models All The Way Down」 - GIGAZINE

in ネットサービス, Posted by log1l_ks

You can read the machine translated English article here.