Google+が終了する前に投稿をインターネットアーカイブに保存しようという試み
Googleのソーシャルネットワークサービス「Google+」は、2019年4月2日のサービス終了がアナウンスされています。5000万人分の個人情報が漏洩するリスクがあるバグが発見されたことでサービスとしての寿命を短くすることとなったGoogle+ですが、サービス終了までに過去に投稿されてきた「一般公開されている投稿」を保存しようと奮闘しているチームが存在します。
The Internet Archive is working to preserve public Google+ posts before it shuts down - The Verge
https://www.theverge.com/2019/3/17/18269707/internet-archive-archiveteam-preserving-public-google-plus-posts
Google+は2019年4月2日にサービスが終了し、そこからプラットフォーム上のデータが削除される予定となっています。そうなるとGoogle+に投稿された過去の投稿は永久にインターネット上から消えてなくなってしまうということで、インターネット上の貴重なデータのアーカイブを行うアーカイブチームが、一般公開されている投稿をインターネットアーカイブに保存する試みをスタートしています。
アーカイブチームは海外掲示板のReddit上で、Google+のポストを保存する取り組みをスタートしたと発表。データのバックアップにはスクリプトを使用しており、一般公開されたポストのみ保存可能で、非公開または削除された投稿をバックアップすることはできないとのこと。加えて、インターネットアーカイブは自分のポストをアーカイブしてほしくない人にはアカウントの削除を促しており、特定コンテンツの削除要求手続きも案内しています。
Saving of public Google+ content at the Internet Archive's Wayback Machine by the Archive Team has begun : plexodus
https://www.reddit.com/r/plexodus/comments/az285j/saving_of_public_google_content_at_the_internet/
アーカイブチームはGoogle+上のすべてのコンテンツをアーカイブすることは難しいとしており、ひとつの投稿につきアーカイブ可能なコメントの数は500件までとしています。また、コメントは静的HTMLとしてポストのサブセットとなるだけなので、投稿に連なる長いディスカッションスレッドのように維持されることとなるかどうかは明らかになっていません。
そのほか、ポストに含まれる写真およびムービーコンテンツはフルの解像度のまま保存されることはなく、解像度を落として保存されることとなる模様です。
アーカイブプロジェクトはPCまたはサーバーシステム上の仮想マシン(VirtualBox、VMWare、またはその他の仮想化システム)上で実行される「グラバー」スクリプトに基づき、「Warrior」と呼ばれるツールを使用することで遂行されるとのこと。記事作成時点では以下のページからWarriorを入手可能なので、アーカイブチームの保存活動を手助けすることもできます。
ArchiveTeam Warrior - Archiveteam
なお、アーカイブチームは「コンテンツのアーカイブはプロジェクトが進行する速度とその管理により制限を受けます。過去の経験から、アーカイブチームはすぐに驚くべき量のデータを保存することが可能で、一般的な成功を収めるでしょう」と記しています。
・関連記事
50万人のユーザー情報が流出したGoogle+がサービス終了、利用低調を理由にするも別の理由が指摘される - GIGAZINE
5000万人の個人情報の漏洩リスクがあるバグ発見でGoogle+が終了時期を2019年4月へ前倒しに - GIGAZINE
Google+の閉鎖が2019年4月2日に決定、シャットダウンまでのタイムスケジュール公開 - GIGAZINE
インターネット上のあらゆる情報を記録・保存する「インターネット・アーカイブ」はどのように運営されているのか? - GIGAZINE
「インターネット・アーカイブのウェイバックマシンが記録した過去のウェブサイトの情報」に証拠能力があると裁判所が認める - GIGAZINE
・関連コンテンツ