ソフトウェア

PDFファイルには目に見えないデータがたくさん眠っている

by Christiaan Colen

PDF(Portable Document Format)は、Adobe Systemsが開発・提唱する電子文書のファイル形式です。どんな環境でも同じレイアウトで表示・印刷でき、リンクや注釈を埋め込むことも可能なPDFは、リリースから25年経った2018年でもなお人気のあるフォーマット。そんなPDFファイルには文書の内容以外にどのようなデータが埋め込まれているのかを、PDFファイルの閲覧・編集ソフトを開発する「PSPDFKit」が解説しています。

What’s Hiding in Your PDF? | Inside PSPDFKit
https://pspdfkit.com/blog/2018/whats-hiding-in-your-pdf/


◆1:情報メタデータ
1993年にリリースされたPDF 1.0以降、PDFファイルには著者・作成日・クリエイター・プロデューサーを入力することができます。また、PDF 1.1以降ではさらにタイトル・件名・キーワード・最後に更新された日時も記録されるようになりました。これによって、たくさんあるファイルから特定のファイルを探し出すことが簡単になっています。ただし、これらの情報は後から編集することも可能なので、必ずしも信頼できるものとはいえず、「情報メタデータが違っても文書の中身は全く同じ」ということもありえるので注意が必要です。


◆2:拡張情報メタデータ
PDFのISO標準規格では、メタデータはストリームに記載され、XMP形式で保持することが可能です。そのため、上記の情報メタデータ以外にも、任意のデータ型をメタデータで表現することが可能。これらのメタデータは閲覧ソフトではレンダリングされないものの、ファイル管理システムによって解析される場合があります。

◆3:オブジェクトメタデータ
ストリームに記載されるメタデータはドキュメントに限定されません。例えば、画像情報をXMP形式に含めることも可能です。なお、XMP形式のメタデータからファイルを取り出したり、変更したりするためのSDKがAdobeから正式に配布されています。

◆4:増分の保存・更新
PDFのISO標準規格にはインクリメンタルセービング(増分保存)の概念があります。増分保存とは、PDFファイルに変更を加えた部分のみを反映して保存するというもの。特にドキュメントをオンザフライで変更する場合、バックグラウンドの自動保存プロセスの動作などを最小限にすることができます。

しかし、増分保存を行った場合、たとえば致命的な情報や誤った情報を一見削除したようでも、ファイルの中にその情報が残っているため、面倒な事が起こりかねません。そのため、PSPDFkitは「再構成での保存(完全保存)」をすすめています。これによって古いオブジェクトがパージされ、PDFのフォームデータが編集できなくなります。


◆5:PDFコメント
プログラミングの世界では、ソースコードをよりわかりやすいものにするために「コメントアウト」を用いて、コードとは別に説明や覚え書きを残すことが多々あります。PDFファイルでも同様に、「%」を使うことでファイルにコメントをつけることが可能です。そのため、PDFファイルをPDFレンダラーではなくテキストエディタで開くと、コメントアウトで製作者からのメッセージが表示されることがあります。PDF閲覧ソフトでPDFファイルを読み込んだ場合、%で囲まれたコメントは無視するので、ファイルは正しく表示され、コメントの内容は一切反映されません。

PDFファイルには一見すると普通の文書のようでも、実は目に見えないさまざまなデータがその背景に眠っています。さらに、PDFはJavaScriptをサポートしているため、オプションは無限大だとPSPDFkitは語っています。また、PDFファイルを閲覧する場合は、どんな情報が潜んでいるのか常に気を配り、特に機密情報であれば誰が作成したものかをデジタル署名で確認する必要がある、と注意を促しています。

この記事のタイトルとURLをコピーする

・関連記事
Twitterの1枚の小さな画像にシェイクスピアの全作品を詰め込んでアップするという試み - GIGAZINE

なぜPDFでサイトを表示するべきではないのか? - GIGAZINE

ネット時代を生き抜く術「ハッキングされないためにできること」まとめ - GIGAZINE

同人誌をこだわって作りたい人向けの「InDesign」と「Illustrator」の使い方&コツをAdobeがまとめて公開 - GIGAZINE

無料でPDFやEPUB形式の電子書籍をアップロードしてブラウザで読める電子書籍サーバー「LibreRead」を使ってみた - GIGAZINE

無料・登録不要・広告ナシでPDFを永遠に保存できてシェアも可能な「PDFy」 - GIGAZINE

無料でコメント・テキスト・画像をPDFファイルに簡単に追加できるPDFビューア「PDF-XChange Viewer」 - GIGAZINE

in ソフトウェア, Posted by log1i_yk

You can read the machine translated English article here.