メモ

エプスタイン・ファイル218GBをAIモデル「Claude Opus 4.6」で精査した結果レポート「Epstein-research」が公開中


児童人身売買や性的虐待の疑いで逮捕されて獄中死したジェフリー・エプスタインの捜査関連データ、通称「エプスタイン・ファイル」が2025年12月から2026年1月末にかけて大量に公開され、世界中を揺るがす大きなスキャンダルとなっています。このエプスタイン・ファイルをClaude Opus 4.6faster-whisperで構造化して分析した方科学分析ライブラリ「Epstein-research」が公開されています。

rhowardstone/Epstein-research: Distilled documents to assist
https://github.com/rhowardstone/Epstein-research

Epstein-researchは、アメリカ司法省から放出されたジェフリー・エプスタインの調査に関する218GBに及ぶ膨大なデータセットに基づき、165以上のフォレンジック分析レポートをまとめたライブラリです。

AIによる分析手法として、テキスト解析にはClaude Opus 4.6が採用されており、検索可能なデータベースを構築した上で全文書の精査が行われています。すべてのページに対してフルテキスト抽出とFTS5による索引付けが実施され、258万件以上の修正記録の分析や、1614名の人物登録簿の作成が構築されました。音声や動画の文字起こしにはfaster-whisper large-v3が利用され、GPU(A100)を用いて1628件のエントリが処理されています。


対象となるデータには、約138万件の文書(277万ページ以上)に加え、動画や音声、スプレッドシートなどの非PDFファイルが3,864件含まれています。分析の結果、7億5500万ドル(約1兆2000億円)を超える資金の流れが追跡されたほか、95以上のダミー会社の存在、捜査段階での失敗などが明らかにされました。

Epstein-researchでは、利用者が自身の環境にデスクトップ版やCLI版をインストールできるClaude-powered Epstein Investigatorというセットアップが用意されています。データベース構築に使用された36以上のPythonツールなどの処理スクリプトも公開されており、すべての分析はクラウドを介さずローカル環境で実行される仕組みとなっています。

報告書内の事実的主張はすべて独自のEFTA番号に紐付けられており、リンクを通じて司法省が公開している原文のPDFを直接確認できる透明性が確保されています。


Epstein-researchを公開したコネチカット大学の計算科学者であるライ・ハワード・ストーン氏は自身を調査ジャーナリストではなくデータサイエンティストであるとしており、内容は人間による独立した検証を経ていないため、鵜呑みにせず慎重に扱うよう求めています。

また、データセットには非常に衝撃的な内容が含まれることから、二次的PTSDのリスクや定期的な休息の必要性が強く警告されており、閲覧は18歳以上の成人に限定されています。さらに、司法省による文書の改ざんや、FBIのデバイスから抽出されたデータの57%が公開データに含まれていないといった不自然な欠落が検出されている点についても言及されており、提供される情報は法的なアドバイスや政府機関の公式見解ではないことが明記されています。

この記事のタイトルとURLをコピーする

・関連記事
公開されたエプスタイン・ファイルのメールをGmailっぽいUIで閲覧できる「Jmail」 - GIGAZINE

エプスタイン関連の動画をYouTubeっぽくまとめた「Jefftube」やエプスタインのAmazon購入履歴をチェックできる「Jamazon」などが登場 - GIGAZINE

エプスタイン・ファイルの情報をまとめたWikipedia風サイト「Jwiki」が登場 - GIGAZINE

「エプスタイン・ファイル」の黒塗りを簡単に暴けることがわかり拡散中 - GIGAZINE

in AI,   メモ, Posted by log1i_yk

You can read the machine translated English article The Epstein-research report, which exami….