インターネット上のあらゆる情報を記録・保存するインターネット・アーカイブは本当はどんな団体なのか?


生まれてはすぐ消えてしまうインターネット上の情報を保存し、資料を無償で研究者や歴史家に提供している非営利団体がインターネット・アーカイブ。名前を聞いたことがあってもどんな団体なのか知らない人も多いインターネット・アーカイブの本部や団体の内側が公開されると共に、運営者ブリュースター・ケール氏が今後の野望やインターネットの不安材料について語っています。

Meet the People Behind the Wayback Machine, One of Our Favorite Things About the Internet | Mother Jones
http://www.motherjones.com/media/2014/05/internet-archive-wayback-machine-brewster-kahle

インターネット・アーカイブ本部やインタビューの様子は以下のムービーから見ることができます。

The Internet Archive's Quest for All Knowledge - YouTube


インターネット上の情報やデジタル化された情報は物理的な媒体と違って保存が難しくすぐに消えてしまうという弱点があります。個人のウェブサイトだけでなく、大手企業であっても同じことが言え、「Googleビデオ」や「Yahoo!ビデオキャスト」、Appleの個人向け有料クラウドサービス「MobileMe」などかつて稼働していたウェブサイトたちは現在閉鎖されています。このような、生まれては次々と消えていくウェブサイトを保存するため、1996年にブリュースター・ケール氏が設立した非営利団体がThe Internet Archive(インターネット・アーカイブ)です。

キャッシュデータ閲覧サービスであるウェイバックマシンを使って過去にアーカイブされた時点のウェブページ情報を保存するだけではなく、インターネット・アーカイブは何百万もの電子書籍やテレビ番組、映画、楽曲、文書、ソフトウェア・タイトルなどを保存しており、「このウェブサイトは1996年にどんな形だった?」ということを調べたり、探しても見つからない貴重な録音ファイルを見つけ出すことも可能です。

例えば1996年の「Mother Jones」ウェブサイトはこんな感じ。


2003年。少しずつデザインが変化していきます。


2006年。


そして2014年現在。


インターネット・アーカイブの本部は2009年にカリフォルニア州サンフランシスコのプレシディオに置かれました。


建物自体は1923年に建設されたもので、2階には礼拝堂があり、教会でよく見られるように床には長いすが並べられ、ホール前方のステージには演壇が置かれています。


そして、実際の人ではなく、人間の半分くらいの大きさの人形が長いすと一緒に並べてあります。


普通の教会と違うのは、壁際にサーバラックがずらりと並べてあるということ。


クラシカルな教会の中で異様な存在感を放つサーバラック。


明るい日差しが差し込む家庭的な雰囲気の一室にも置いてあります。


礼拝堂には、アーロン・スワーツ氏の人形も飾られていました。


プログラマーでインターネット活動家でもあったアーロン・スワーツ氏は「知識の『私有化』に反対する活動」を行っており、マサチューセッツ工科大学(MIT)のウェブサイトに不正アクセスして学術論文のデータベースから大量の記事や論文をダウンロードすることで社会に疑問を投げかけましたが、この1件が起訴され、精神的に追い詰められた末に自殺したと見られています

「彼らは恥を知るべきです。この事件は古い世界と古いアプローチが近いうちに崩壊するということの象徴だと私は思っています。いくつかの組織は制限に制限を重ねた考えを元に作られており、その制限のせいで自由に飛べなくなるでしょう」とケール氏。


ケール氏は知識へのアクセスを制限することに反対する一方で、インターネットユーザーのプライバシーの権利についても強く支持しています。

2007年、米国連邦捜査局(FBI)がインターネット・アーカイブに対し、ある登録利用者の氏名・住所・ウェブサイト利用履歴を提出するよう求める国家安全保障書簡(NSL)を発行し、同時に口外禁止規定を課しました。これに対しケール氏は「インターネット・アーカイブがカリフォルニア州から認められている『図書館』であること」などを論拠にNSLの合憲性に関して提訴。そして訴訟の結果、FBIはNSLを取り下げるとともに、文書の一部を公開することに合意しました。

図書館が政府を訴えるという事態は異例ですが、この件でFBIとインターネット・アーカイブの関係が悪化したということはなく、インターネット・アーカイブはアメリカの国立図書館であるアメリカ議会図書館に対してウェブクローニングや書籍のスキャンといったサービスの提供も行っており、また特許商標庁はウェイバックマシンを使用しているそうです。


インターネット・アーカイブで急成長している分野の1つが「テレビニュース・アーカイブ」。アメリカでは1週間のうち65のニュースチャンネルが国内・国外のニュースを流しており、インターネット・アーカイブのサーバーはそれらを録画。プロジェクトを取り仕切るロジャー・マクドナルド氏によると、クローズドキャプションデータを使って放送すれば世界中から番組データの検索が可能になるのですが、テレビやケーブルのネットワークの多くはクローズドキャプションデータを使いたがらないため、インターネット・アーカイブが映像を検索可能にする作業を行っているとのこと。これによって、例えばハーバード大学やMITの学者らは「メディアがトレイヴォン・マーティン事件をどのように伝えたか」を研究した時に、クローズドキャプションデータを使ってテレビニュースアーカイブを調べ、物事の流れを把握することができるようになったわけです。

そして、このテレビニュース・アーカイブを急成長させたキッカケの1つが、2013年にインターネット・アーカイブの活動を知るマイケル・メテリッツ氏から「4万本のテープを受け取ってくれ」というメッセージが送られてきたこと。メテリッツ氏によると、「母親が亡くなったのだが、彼女は35年間にわたりフィラデルフィアとボストンでニュースを録画し続けており、母亡き後テープの置き場に困っている」とのこと。マクドナルド氏は始め「4万本」という数字に誤植かと思ったのですが、メテリッツ氏からビデオの山を受け取りました。


テレビニュース・アーカイブは2000年に開始されたプロジェクトであるため、過去のニュース収集に困っていたマクドナルド氏らにとって、これは金塊のようなものでした。テープは状態がいいだけではなく、クローズドキャプションデータで録画されており、メタデータを得ることができたのです。

しかしカリフォルニア州リッチモンドで保管されている大量のビデオテープをデジタル化して記録するのが果てしない作業になることは火を見るより明らかで、マクドナルド氏は「ここに何があるのか、まだほんの触りの段階でしかない」と語っています。


これがリッチモンドにある物理的なデータの保管場所。


ここにもサーバがずらりと並んでいます。


狭い通路を抜けると……


大量に現れる書籍。


書籍やビデオテープなどが詰められた段ボールで部屋は埋め尽くされています。


部屋の上部から物理的なデータを眺めるとこんな感じ。


本部のあるサンフランシスコ市についてケール氏は「まだインターネット・コミュニケーションの十分なインフラが整っていない」と考えており、インターネット・アーカイブは1998年以来、サンフランシスコ市で無料のWi-Fiを提供する「SFLan」という非営利プロジェクトを実行中。データの収集は無料のインターネット放送を行うためのアンテナに過ぎない、とケール氏は語ります。

このほか数多くのプロジェクトが行われており、例えばテクノロジー企業の流入によってサンフランシスコ市は住宅供給に対して需要が相当過多になっているのですが、テクノロジー産業のコンセプトである「オープンソース」という考えを住宅市場にも適用し、この問題を解決しようとケール氏は考えています。インターネット・アーカイブは他の非営利団体と団結し6ブロックにわたるアパート11棟を購入しており、これを2014年末に引っ越してくる従業員に対して家賃なしで提供する予定。ケール氏の夢は全ての住宅供給のうち5%を非営利部門で働く人々を支えるための無料住宅に変えることだそうです。

大きな野望を掲げながらも、一方で「ネットワーク中立性が失われたりネットの独占が起こってしまえば、我々が数十年間インターネット上で保存してきた『魔法』が消えてしまいます。政府は商業的な企業に左右されてしまうため、政府が行動を起こすのを待ってはいられないのです」とインターネットの危うさに対してケール氏は懸念しています。現在のインターネットのあり方については「朝目覚めて真剣に落ち込む時と楽観的になれる時があります」と回答。そして「争いが起こると『自分がどちらの味方についているのか知るべきだ』と言われますが、インターネット・アーカイブがどちらの側についているのかを知っています」と付け加えました。

インターネット・アーカイブは2012年10月にアーカイブ量が10ペタバイトに到達したことを発表しており、ケール氏は現在ウェイバックマシンが保持しているデータ容量を15ペタバイトぐらいだと予想しています。

アレクサンドリア図書館という、世界中の文献を収集することを目的として建設された古代の図書館がありますが、ケール氏が目指しているのは第2のアレクサンドリア図書館。データは時間と共に増加していくため世の中の全ての文献を収蔵することは難しそうですが、保存されていくデータ量の増加を考えると、インターネット・アーカイブが第2のアレクサンドリア図書館になる未来はそう遠くはなさそうです。

・関連記事
全ての情報へアクセス可能な「知の世界」を目指すインターネットアーカイブのドキュメンタリームービー - GIGAZINE

Internet Archiveのアーカイブ量が10ペタバイトに到達 - GIGAZINE

インターネットアーカイブが年末までに1300万円の寄付を募集 - GIGAZINE

インターネットアーカイブが情報だけでなく古いTシャツも募集中 - GIGAZINE

全知識への普遍的なアクセスを目指す「Internet Archive」が寄付を募集中 - GIGAZINE

in 動画,   メモ, Posted by logq_fa