メモ

偽のウェブサイトを使って「盗用記事」を偽造しGoogle検索結果からコンテンツを削除する方法

by NegativeSpace

自分のコンテンツが誰かにコピーされてオンラインに掲載された場合、デジタルミレニアム著作権法(DMCA)に基づきGoogleの検索結果から削除するよう申請することができます。しかし、この仕組みを悪用し、自社や自サービスの評判を落とすような「本物の記事」を、偽のウェブサイトを使って削除する事例が報告されています。

Data from the Lumen Database Highlights How Companies Use Fake Websites and Backdated Articles to Censor Google’s Search Results :: Blog :: Lumen
https://www.lumendatabase.org/blog_entries/800


「盗用記事」を理由にしたコンテンツ削除の不正申請は2013年頃から発生しだしたとのこと。インターネット上に自分が気に入らない記事を見つけた個人あるいは企業は、「評判管理会社」に連絡をするケースが多々あります。このような評判管理会社は、偽のウェブサイトを作成して「本物のニュースサイト」のように見せかけ、その中の記事の掲載日を過去へとさかのぼらせて、削除したい記事よりも先に掲載されていたように装います。そして、評判管理会社は「ジャーナリスト」を語って「自分の記事が盗用されている」としてGoogleにDMCA侵害を申し立て、記事を削除するよう働きかけます。なお、DMCA侵害情報の管理はLumenという会社が行っており、申し立てを行った人の名前や内容はウェブ上で公開されるのですが、評判管理会社が申し立てを行うので本当の「依頼人」の名前は公開されません。

LumenリサーチのMostafa El Manzalawy氏は、Lumenデータベース、Googleの透明性レポート、ニュース記事、特定ドメインのWhois情報を検索することが可能なDomainToolsなどを使って、実際に行われた偽の削除申請を調査しました。

例えば「Fox18 News Network LLC」がその1つで、この会社は「ティーンの治療プログラム『Trails Carolina』について書いたNew York Daily Newsの記事は自社ウェブサイトから盗んだものだ」と主張しました。New York Daily Newsの記事は2014年11月26日に公開されていますが、Fox 18 News Network LLCは、自サイトの記事が2014年11月25日に公開されたとしています。

Whois情報を見てみると、Fox 18 News Network LLCのドメイン登録が最後にアップデートされたのは2015年8月24日とのこと。新しいドメイン登録者の名前は「Registration Private(プライベートな登録)」となっており、居住地はアリゾナ州のスコッツデールで、「この日にドメインが新たな所有者に購入されたように見える」とManzalawy氏は述べています。


IPアドレス履歴は2015年9月1日に変更があったことを示しており……


ホスティング・サーバーの履歴からは2015年8月27日に変更があったことが見てとれます。


出来事を時系列順に並べると以下のような感じ。

・2014年11月26日
New York Daily Newsが治療プログラム「Trails Carolina」についての記事を書く

・2015年8月24日
fox18news.comのWhois登録データが新しい所有者に更新される

・2015年8月27日
fox18news.comがホスティング・サーバーを変更する

・2015年9月1日
IPアドレスが変更される

・2016年4月12日
DMCAに基づく削除通知がNew York Daily Newsに送信される

そして、2017年8月時点でFox 18 Newsは存在せず、DMCAの削除通知の根拠となった記事やニュースサイトも存在しません。


Fox 18 Newsのドメイン履歴は、「New York Daily Newsが記事を掲載した9カ月後にドメインが取得された」ということを記しています。それにも関わらず、Fox 18 Newsの記事はNew York Daily Newsに先だって公開されたように見えていました。これは、記事が「本来よりも遡った日付の設定で投稿(バックデート)」されたことを意味します。

さらにManzalawy氏は、DMCAの削除通知が送られた時点でのFox 18 Newsの記事がどんなものだったのかを調査。Internet Archive: Wayback MachineWebpage archiveLog in to DomainToolsInternet Activism and Citizen Protectionなどを使って当時のスクリーンショットを探し出しました。その結果、Wayback Machineは「2016年3月に初めて『fox18news.com』が『ニュースサイト』として現れるまで、2006年5月からウェブページのアーカイブは存在しない」と示しました。2014年や2015年のスクリーンショットは存在するものの、最終的にはリンクは繋がっていなかったそうです。

WebActivismに記録されていた記事は、2014年11月25日、つまりNew York Daily Newsが記事を公開する1日前に確かに「公開」されたことになっていました。以下が2014年11月25日に公開された、とするfox18news.comの記事のスクリーンショットで……


これが2014年11月26日付で発表されたNew York Daily Newsの記事。


これらの内容から、Manzalawy氏は「New York Daily Newsの記事が公開された1年後にFox 18 Newsの記事は公開され、『記事が先に公開された』ということを印象づけるためにバックデートが行われた」と結論づけています。

Lumenデータベースの調査では、合計52件のURLをGoogle検索結果から削除することを目的とした42の削除通知が見つかったそうです。そして、この通知にはあるパターンが存在するとManzalawy氏は説明しました。以下がその「パターン」を視覚的に表したもの。「article」「content」「copied」という言葉が頻繁に使用されていることがわかります。


通知の一例は以下の通り。もちろんこれとは異なるフレーズが使われることがありますが、一般的には以下のようなアプローチが取られます。

「私は【ここに偽ウェブサイトの名前】のジャーナリストです。【ここに記事の主題】についての私の記事が、私の許可なくコピーされています。作品の全ては盗まれ、許可なく【ここに本物のウェブサイト名】に投稿されています。この記事をGoogle検索結果から削除してください」

Manzalawy氏が見つけた42の通知のうち、11の通知に記事とは関係のない部分に句読点の誤りがあったそうです。また記事削除を求める申請はイギリス、オーストラリア、インド、インドネシア、アメリカの複数の州から、表面上はランダムなドメインを代表して送られていましたが、いずれも書き方は同じで、ドメイン登録の居住地がアリゾナ州スコッツデールであることも共通していました。「これは偶然ではない」とManzalawy氏は述べています。スコッツデールで登録を行った1つの評判管理会社が、世界中のさまざまなビジネスにおいて、Google検索からのコンテンツ削除を引き受けている、とManzalawy氏は考えを述べました。

偽のウェブサイトを使った削除申請は2013年4月頃から行われるようになり、2013年に認められたDMCAに基づく削除申請は2件でしたが、2014年には3件になり、2015年には11件、2016年には18件の申請が認められることになりました。


Googleの透明性レポートによると、2017年8月15日までに52件の削除申請が承認されており、これは、偽のウェブサイトを利用して著作権違反に基づきGoogle検索結果からの削除を申請した疑いがあるもののうち、30%が成功しているということを意味するそうです。なお、この数字は、削除後に不正がニュースで報道されたものを含みません。

「盗用記事」とウソをついて記事を削除すること自体は法律上の議論となっているものの、その頻度や成功率まで含めた包括的な研究は存在しないとのこと。今回の調査では52件のURL削除が明らかになっていますが、さらなる調査で数百件の削除が判明していも不思議ではない、とManzalawy氏は述べています。なお、WebActivismの関係者は、この不正の責任を負うべき主要な3つの機関を特定したと述べています。また、複数の評判管理会社を相手にした訴訟も行われているとのことです。

この記事のタイトルとURLをコピーする

・関連記事
旅のあり方を激変させた「トリップアドバイザー」が直面する大問題とは? - GIGAZINE

裏庭の物置小屋をロンドンで最も人気のレストランに仕立て上げる方法が公開中 - GIGAZINE

Yelpのクチコミを「超高評価に操作するソフト」の販売会社が訴えられる - GIGAZINE

Googleはユーザーのためになっていないと口コミレビューサイトのYelpが痛烈に批判 - GIGAZINE

Googleが海賊版コンテンツを閉め出すために検索結果からの該当リンクを削除している - GIGAZINE

「忘れられる権利」によるGoogle検索結果の削除依頼でわかる傾向とは - GIGAZINE

Googleが「忘れられる権利」により削除したURLの詳細な内訳が示された「透明性レポート」2018年版を公開 - GIGAZINE

Googleに検索結果の削除要請する際の根拠となる「忘れられる権利」とは何か? - GIGAZINE

in メモ, Posted by darkhorse_log

You can read the machine translated English article How to forge 'stolen articles' using fak….