メモ

Wikipediaはいかに改竄・ねつ造など荒らし行為を駆逐し続けてきたのか?

By Maia Weinstock

インターネットのフリー百科事典「Wikipedia」はちょっとした調べものに非常に便利で、仕事や趣味でお世話になることも多いもの。しかしWikipediaは集合知という側面も持ち合わせており、誰でも簡単に編集できるという特性上、内容を改竄したりねつ造したりといった悪意ある者による「荒らし」行為はつきものです。Wikipediaを運営するWikipedia財団ではそんな荒らし行為を「Vandal(破壊者)」と呼ぶそうで、Wikipediaの歴史とはVandalとの闘いの歴史といっても過言ではありません。

This machine kills trolls | The Verge
http://www.theverge.com/2014/2/18/5412636/this-machine-kills-trolls-how-wikipedia-robots-snuff-out-vandalism


Wikipediaは専門家によるオンライン百科事典プロジェクト「Nupedia」を前身として、ジミー・ウェルズ氏とラリー・サンガー氏によって2001年にスタートしました。誰もが編集に参加できるという特徴が世界中の人に受け入れられ、開始から4年後には75万を超えるページが作成されるなど、あっという間にネット世界のメインストリームに躍り出ることになります。

しかしWikipediaの人気が高まり多くの人が編集作業に加わるのにしたがって、稚拙な内容のページが急増。またWikipediaを宣伝に用いるなど不適切な投稿が横行するようになり、Wikipedia財団の悩みの種になりました。Wikipediaの持つ「誰もが参加できるスタイル」があだとなったわけです。この問題に頭を悩ましたウェルズ氏は、2006年にWikipedian(Wikipediaを編集する人たちの愛称)に向けて「記事の質をいかに保つべきか?」という内容の基調講演を実施しました。その結果、価値の低い新規投稿は明らかに減ったものの、その代わりにページが作成されるペースが大幅に減少することが確認されたとのこと。

ちょうどそのころ、故意にページ内容を改竄したり、意味のない言葉でページを埋め尽くしたり、写真を内容とはまったく関係のないキャラクターイメージに変更したりといった明らかに悪意ある編集行為が出現し始めました。このような「荒らし」行為はWikipediaの信頼をおとしめるものであり、緊急に対応すべき問題であることは明らかでした。

By Taís Melillo

このWikipediaの危機を受けて、4人のWikipedianがAntiVandalBot(AVB)と呼ばれる「荒らし駆逐ボット」を開発することになります。AVBは比較的新しい投稿・編集内容を監視して簡単な法則に従って荒らし行為を判定し、自動的に荒らし以前の適切な内容に修正する機能を持ちます。AVBが対応するのは誰の目にも明らかな荒らし行為に限られ、内容が適切なものであるかが微妙なケースは人間によって判断し必要があれば修正するというように、AVBと人力のコンビネーションによって、指数関数的に増加する荒らし行為に対応することに成功します。

Wikipedia財団で働くアーロン・ハルフェイカー氏は、仮にAVBがなければ多くのWikipedianはVandalに圧倒されたであろうとし、「AVBを見る度に、多くの人を悲しみにくれさせる敗北からWikipediaを救ってくれたと感じます」と述べています。

By Andrew Becraft

2007年、ヤコビ・カーター氏はAVBを正常進化させた「Cluebot」を開発しました。カーター氏によると、適切に編集された多くのページがAVBによって誤って変更されていたり、明らかに改竄とみられる内容が放置されるのを目の当たりにしてCluebotを開発したとのこと。なお、カーター氏は当時現役の高校生でした。

Cluebotは、文法の正確さ・不適切な表現・個人攻撃などに関するデータをコード化しポイント制にすることで荒らし行為か否かを判定するアルゴリズムを採用しました。Cluebotは導入最初の2カ月でなんと2万件以上の荒らし記事を修正することに成功。それ以来、3年という長期間に渡って使われWikipediaの質を保ち続けることになります。

2010年にカーター氏はCluebotの次世代バージョン「Cluebot NG」を開発、機械学習によって荒らし判定精度を高めていく能力を組み込みました。機械学習にとってのキモは「データの蓄積」であるところ、Wikipedia財団には、それまで人間の手で荒らし行為を分類した約6万通りのパターンがあったためCluebot NGは存分に機械学習効果を発揮できたとのこと。

毎分9000件を超える編集作業を実行できるCluebot/Cluebot NGによる修正は2013年始めに累計200万件を突破。しかし、Cluebot NGが24時間365日休むことなくVandalを駆逐するとはいえ、100%の精度で荒らし判定を行うことは不可能であり、依然として誠実な編集行為を荒らし行為と判定してしまう「偽陽性」の問題は横たわったままでした。この偽陽性の問題を解決する最後の砦は今も変わらず「人力」です。

By Johann Dréo

微細な改竄を少しずつ繰り返して内容を変更するような巧妙な改竄行為を見抜くのはCluebot NGと言えども至難の技です。このような巧妙な改竄行為を見つけ出し、適切に修正する作業のほとんどは人間の手によってなされています。古くからのWikipedianであるSeaPhoto氏は、荒らし修正人として有名な人物で、これまでに5万5000件の修正作業を行ったとのこと。SeaPhoto氏は「Vandalを相手にした修正行為は楽しいものです。しかし、Wikipediaで編集を行うすべての人に対して、『その編集によって誰かを傷つけやしないか?』ということを一瞬でよいので確かめる時間を作って欲しいです」と語っています。

ハルフェイカー氏は、Wikipediaには常時、「Vandal VS人間と優秀なツール連合」という構図が存在することは認めつつも、Wikipediaは単なる戦闘地帯ではないと語ります。Wikipediaの精神とは、複雑な社会関係が横たわる中で見知らぬ人との共同作業を行うこと。新しいユーザーが安心して編集作業に参加できるよう環境を整えるために、今後もWikipediaは荒らし行為と終わりのない闘いを続けていくことでしょう。

・関連記事
Wikipediaの舞台裏「Wikipediaの管理者」とは? - GIGAZINE

Wikipediaで編集合戦が行われている記事主要言語別トップ10 - GIGAZINE

Wikipediaを悩ませる「なりすまし投稿」とその黒幕ステマ会社「Wiki-PR」社とは? - GIGAZINE

Wikipediaに記事内容を削除するよう圧力をかけたら逆に注目を集める結果に - GIGAZINE

これがWikipediaの裏側、知られざる大規模システムの実態「Wikipedia / MediaWiki におけるシステム運用」 - GIGAZINE

in ネットサービス,   メモ, Posted by logv_to