ネットサービス

Internet Archiveは4年ごとにアメリカ政府のウェブサイトを丸ごと保存しており2024年から2025年にかけて500TB以上アーカイブ


アーカイブ閲覧サービス・Wayback Machineを運営するInternet Archiveは、アメリカ政府のウェブサイトをすべて保存するプロジェクト「End of Term Web Archive」プロジェクトを大統領の任期が満了する4年おきに行っています。Internet Archiveは2025年2月6日に、2024年から2025年にかけて1億を超えるウェブページを含む500TB以上の資料を収集したことを明かしました。

Update on the 2024/2025 End of Term Web Archive | Internet Archive Blogs
https://blog.archive.org/2025/02/06/update-on-the-2024-2025-end-of-term-web-archive/

End of Term Web Archive | The End of Term Web Archive is a collaborative initiative that collects, preserves, and makes accessible United States Government websites at the end of presidential administrations.
https://eotarchive.org/

Internet Archiveが進める「End of Term Web Archive」プロジェクトとは、現行の大統領政権の終わりにアメリカ政府のウェブサイトやソーシャルメディアコンテンツなどをすべてキャプチャして保存するというもの。これまでにInternet Archiveは、2008年2012年2016年2020年にウェブサイトの保存を行っています。

End of Term Web Archiveでは、政府の立法、行政、または司法部門の政府関連ウェブサイトを保存しています。これらのウェブサイトは、大統領の交代に伴って、変更されるか完全に削除されるリスクがあるとのこと。なお、地方自治体のウェブサイトや政府のドメインを使用しない一部のサイトは保存の対象外です。


ジョー・バイデン前大統領政権が2025年1月20日に終了するのを受けて、Internet Arciveを含む各種機関はこれまでと同様にウェブサイトの保存を開始。Internet Archiveなどが「保存すべき」と判断したウェブサイトは以下から確認可能で、記事作成時点で1万1311件のURLが登録されています。

Nomination Tool: Project URL Nomination
https://digital2.library.unt.edu/nomination/eth2024/


以下はEnd of Term Web Archiveで保存されるファイルの一覧で、過去のEnd of Term Web Archiveプロジェクトを含め、データセットを一括で保存することも可能です。
・HTMLファイル
・画像ファイル(JPEG、PNG、GIF)
・PDFファイル
・スプレッドシート(CSV、Excelなど)
・ビデオおよびその他のマルチメディア
・GeoJSONおよびその他の特殊なファイル

そしてInternet Archiveは2025年2月6日に、「プロセスの3分の2が完了し、1億を超えるウェブページを含む500TB以上の資料が収集されました」と報告しています。Wayback Machineのディレクターであるマーク・グラハム氏は「政府の記録や成果に国民がいつでもアクセスできることは非常に重要です。政府が公開した資料の多くは、国民全員にとって健康、安全、セキュリティ、教育などの面でメリットがあります」と述べています。

2024年のEnd of Term Web Archiveの一部として保存されたコンテンツを閲覧したい場合、Wayback Machineのトップページ内「Collection Search」の欄にあるドロップダウンメニューを開き「End Of Term (US Gov 2024)」をクリック。


政府機関の名前といったキーワードやURLを入力して「SEARCH」をクリック。


ウェブページの一覧が表示されるので、目的のページをクリックすると保存されたページを閲覧することが可能です。


Internet Archiveは「ウェブアーカイブは、単に履歴を保存するだけでなく、将来の世代のために情報へのアクセスを確保しておくためのものです。End of Term Web Arciveは、他の方法では失われる可能性のある政府のウェブサイトを保護するのに役立ちます。End of Term Web Arciveは、この情報を保存し、アクセス可能にすることで、研究者やジャーナリスト、市民が政府の政策と決定の進化を追跡できるようにしています」と述べました。

この記事のタイトルとURLをコピーする

・関連記事
ウェブ上の情報を記録・保存する「インターネット・アーカイブ」の存続をひっそりと脅かしているものとは? - GIGAZINE

インターネットアーカイブがカリブ海の島「アルバ」と協力して10万点超の歴史的資料をデジタルアーカイブとして公開 - GIGAZINE

インターネットアーカイブが電子書籍の貸出をフェアユースだと主張した裁判で再び敗訴 - GIGAZINE

Google検索から直接Internet Archiveでアーカイブされたウェブページを閲覧できるように - GIGAZINE

ネット上のコンテンツを保存する「インターネットアーカイブ」がDDoS攻撃の影響によるダウンから復活 - GIGAZINE

in ネットサービス, Posted by log1r_ut

You can read the machine translated English article The Internet Archive is archiving the en….