無料で潜在的に危険なPDFファイルや画像を安全なPDFファイルに変換する「Dangerzone」

PDFファイルは単なる文字と画像の文書ではなくメディア埋め込みや圧縮データ、JavaScriptなど複雑な構造を持っているため、信頼できるかどうかわからない発信元から取得したPDFファイルを開いた場合、スクリプトが動いてマルウェアが実行してしまう攻撃を受ける可能性があります。「Dangerzone」は危険な可能性があるPDFファイルを開く前に「無害化」できるアプリケーションで、元ファイル内の悪意ある構造が含まれる可能性がある部分を削除した上で同じ見た目のPDFファイルを返してくれます。
Dangerzone: Convert potentially dangerous documents into safe PDFs
https://dangerzone.rocks/
Dangerzoneは信頼できないPDFファイルを渡すことで、ドキュメントを安全なサンドボックス内で表示した上で、内容をピクセルにレンダリングしして新しいPDFとして再構築します。見た目だけコピーして作り直す形になるため、仮にマルウェアが含まれていたとしても破壊された状態で安全に中身を見ることができます。DangerzoneはPDFファイルのほかにも、Microsoft OfficeまたはLibreOffice文書、画像など、様々な種類の文書を安全なPDFに変換して開くこともできます。
Dangerzoneを利用するにはまずPCにダウンロードします。配布サイトにアクセスして「Download」をクリック。

DangerzoneはMacOS版とWindows版があります。今回使用するのはWindowsのため、「Download for Windows」をクリックしてダウンロード開始。Windows版Dangerzoneのインストーラーは約1.1GBです。

ダウンロードが終わったらインストーラーをダブルクリックして起動。

「Next」をクリック。

チェックを入れて規約に同意したら「Next」をクリックします。

「Next」をクリック。

「Install」をクリックしてインストール開始。

インストールが終わったら「Finish」をクリックします。

Dangerzoneを起動すると、Windows Subsystem for Linux(WSL)をインストールするように表示されました。「Install WSL」をクリック。

WSLのインストールが終わったら「Reboot now」をクリックしてPCを再起動します。

改めてDangerzoneを起動したら、無害化させたいPDFをドラッグ&ドロップするか「Select suspicious documents...」をクリックします。

PDFファイルを選んで「開く」をクリック。

設定画面では「OCR document language」のプルダウンメニューから「Japanese」を選択。縦書きの日本語にも対応しています。

「Convert to Safe Document」をクリックして変換開始。

PDFファイルがあった位置に「-safe」と末尾についた無害化ファイルが追加されました。元のPDFファイルは「unsafe」というフォルダの中に入っています。

比較のため、元のPDFファイル(左)と無害化したPDFファイル(右)を並べて開いてみました。このPDFファイルはGIGAZINEの記事をPDFファイルにしたもので、以下の表紙ページは左右で同じように見えます。

一方で、以下の目次では大きな違いが生まれています。どちらも見た目では「目次」という黒いテキストと、目次の内容が青いテキストで記述されています。2つのファイルで同じように「長期休暇や週末になると体調を崩しがちなのはなぜ?」という部分をクリックしてみます。

すると、左の元のPDFファイルでは本編1ページ目にジャンプしましたが、右の無害化したPDFではテキストを選択した状態になりました。今回使用したPDFファイルでは一部テキストにリンクが埋め込まれており、テキストをクリックするとPDFの特定のページにジャンプしたり外部ページを開いたりしますが、無害化の際にリンクの埋め込みは削除されて見た目だけが保持されているため、無害化したファイルでは同じテキストをクリックしても反応しません。

外部リンクを埋め込んでいる部分も同様で、左の元ファイルではクリック可能になっていますが、右の無害化したファイルではテキスト選択のカーソルになっており、リンクをクリックできません。PDFが信頼できない発信元から取得したものでも、埋め込まれたリンクやJavaScriptが全て削除されて見た目だけコピーされているため、安全に読むことができるというわけです。

Dangerzoneはオープンソースのソフトウェアで、GitHubで詳細をチェックすることができます。
GitHub - freedomofpress/dangerzone: Take potentially dangerous PDFs, office documents, or images and convert them to safe PDFs
https://github.com/freedomofpress/dangerzone

・関連記事
スキャン書籍のPDFファイルを電子書籍並みにクリアで読みやすくするAI・高品質化・各種調整ツール「DN_SuperBook_PDF_Converter」 - GIGAZINE
PDFファイルを修正するのに「黒塗り」では情報漏えいのリスクがある - GIGAZINE
無料&アカウント登録なし&ブラウザ上で完全に動作するプライバシー重視のPDFエディター「LocalPDF」 - GIGAZINE
あの「DOOM」がついにPDFファイルに移植される - GIGAZINE
ブラウザ内蔵PDFビューアでテトリスがプレイできる「PDFトリス」が登場 - GIGAZINE
・関連コンテンツ
in ソフトウェア, レビュー, Posted by log1e_dh
You can read the machine translated English article Dangerzone: Convert potentially dangerou….







