ネットサービス

Wikipediaの客観性は数百万ものリンク切れURLを修復するインターネット・アーカイブによって確保されている


インターネット上のあらゆる情報を保存することを目指すインターネット・アーカイブが、Wikipediaに書かれた情報の客観性を確保し検証可能な状態に保つために、リンク切れとなったURLリンクを修復する作業を行っています。

More than 9 million broken links on Wikipedia are now rescued | Internet Archive Blogs
https://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued/

インターネット・アーカイブの運営目標の一つに、「ウェブを信頼できるものにする」という取り組みがあります。この重要な目標の実現にあたって、インターネット・アーカイブはオンライン百科事典のWikipediaと協力して、Wikipediaの信頼性確保に努めています。


誰でも編集可能なWikipediaでは、情報の正確性を確保するため、URLなどを特定する形で情報源を記し、第三者が検証できるようにすることが要求されています。しかし、情報源となったソースのウェブページが何らかの事情で事後的に閉鎖され、「404」エラーページが返される「壊れたリンク」になるということは珍しくなく、リンク切れに伴う情報源の消失によって、Wikipediaの内容の正確性・客観性が損なわれる事態を招いています。

そこで、インターネット・アーカイブでは、Wikipediaコミュニティで「Cyber​​power」という異名で知られ、インターネット・アーカイブのコンサルタントを務めるマクシミリアン・ドゥーアー氏と、同じくWikipediaコミュニティで長らく記事編集ボランティアに携わるステファン・バルバック氏の2人と協力して、Wikipediaのリンク切れページを探し出し、すぐさまインターネット・アーカイブの保存するバックアップページへのリンクに差し替えるプログラムを開発し、運用しています。

Wikipedia内の情報のソースとなるURLがリンク切れを起こした例。


インターネット・アーカイブの保存ページには、消失する前の情報が残っています。この以前のページにリダイレクトすることで、たとえ情報源が失われても、Wikipediaユーザーは内容を確認して検証することができるというわけです。


インターネット・アーカイブによって開発されたソフトウェア「IABot」は、404エラーを返す「壊れたリンク」を22言語の各Wikipediaで探します。リンク切れが見つかると、IABotはWayback Machineなどに保存されているリンク切れページを検索します。その後、リンク切れを起こしたURLは、インターネット・アーカイブ側に保存されたページへのリンクに差し替えられ、Wikipediaの検証可能性を維持するという仕組みが取り入れられています。

Wikipediaを運営するウィキメディア財団が、Wikipedia内の外部リンクをユーザーがどのように利用しているのかを調査したデータによると、外部リンクのクリックスルー数はインターネットアーカイブのWayback Machineがダントツ。試験的に行われた直近10日間の調査結果では、Googleブックス(books.google.com)の3倍の規模であることが判明しています。


3年間のIABotの運用で404になった外部リンク600万件を修正し、Wikipediaコミュニティ自身も個別に300万件のリンクを修正し、合計900万件もの壊れたリンクが改修されたそうです。

インターネット・アーカイブによると、「リンク切れによる検証可能性の喪失」への懸念は、2013年に明らかになった「最高裁判決で引用されたページの49%がリンク切れ」という問題をきっかけに注目されるようになったとのこと。ここからリンク切れを起こす前に情報を確実に捕捉しておく重要性を学んだそうです。

今後は、「リンク切れ」だけでなく、「コンテンツのドリフト」と呼ばれる時間の経過に伴って内容が変更される問題に対しても取り組むことが求められているとのこと。Wikipedia上に表示されたリンク先ページの内容が、Wikipedia記事作成時の意図とは異なるものに変更されていることをユーザーが知ることができる手段の確保などが求められているそうです。

この記事のタイトルとURLをコピーする

・関連記事
インターネット上のあらゆる情報を記録・保存する「インターネット・アーカイブ」はどのように運営されているのか? - GIGAZINE

全ての情報へアクセス可能な「知の世界」を目指すインターネットアーカイブのドキュメンタリームービー - GIGAZINE

「インターネット・アーカイブのウェイバックマシンが記録した過去のウェブサイトの情報」に証拠能力があると裁判所が認める - GIGAZINE

Wikipediaから削除された項目を集めた「Wikitruth」 - GIGAZINE

WikipediaがGoogleに対抗する広告なしの検索エンジンを開発へ - GIGAZINE

Wikipedia創設者ジミー・ウェールズがフェイクニュースと戦う「Wikitribune」を立ち上げる - GIGAZINE

in ソフトウェア,   ネットサービス, Posted by darkhorse_log

You can read the machine translated English article here.