ソフトウェア

スキャン書籍のPDFファイルを電子書籍並みにクリアで読みやすくするAI・高品質化・各種調整ツール「DN_SuperBook_PDF_Converter」


書類や本を自分でスキャンしてPDFファイル化してPCやタブレットで読めるようにする時、画質が低かったり、スキャンの精度が低かったり、インクのにじみや裏写りがあったりして可読性が低下してしまうことがあります。自分で本を裁断してスキャンする「自炊」で用意したPDFファイルを読みやすくするためのツール「DN_SuperBook_PDF_Converter」を、研究者でプログラマーの登大遊氏がAGPL-3.0ライセンスの下で公開しました。

dnobori/DN_SuperBook_PDF_Converter: DN_SuperBook_PDF_Converter - スキャン書籍 PDF をデジタル書籍並みに大変クリアに読みやすくする AI PDF 高品質化・各種調整ツール
https://github.com/dnobori/DN_SuperBook_PDF_Converter

登氏は「コンピュータ分野も、他の分野も、多くの重要かつ多様な知識は、古典的な紙の書籍にしか存在しません。絶版になってしまった書籍でしか手には入らない価値のある専門知識が数多くあります。さらには、新刊ですら、電子書籍がなかなか出版されない例が、未だ多くあります。現代型学生にとって、本来、紙でしか入手することができない書籍を、PDF形式に自炊し、これをPCやタブレットで快適に読むことができるような環境を整備することは、デジタルとして出版・公開されている情報のみを摂取する場合と比較して、圧倒的に有利な結果をもたらします」と語り、「紙の書籍スキャンPDFを極めて読みやすくし、ストレスをゼロに近付ける」ことを「DN_SuperBook_PDF_Converter」の目的としています。


登氏は、自炊したPDFファイルにおける既存の課題として、「紙の書籍のスキャン結果は画質が低いこと」「微妙な傾きがあること、かつそれがページごとに異なること」「各ページのスキャンオフセットがずれてしまいページ送りする際にガタガタすること」「余白自動除去によって各ページの余白部分がトリミングされた結果、さらにガタガタになること」「書籍のページ番号とPDFビューアにおけるページ番号とがズレること」「見開き表示する際に、左側ページと右側ページとが自動判別されないこと」「縦書きの書籍において、ページ順序 右→左にするフラグを立てる必要があること」を挙げています。

「DN_SuperBook_PDF_Converter」は、画像鮮明化AIエンジンであるRealEsrganと自作のアルゴリズムを元に、紙の汚れ、裏写り、インクにじみ、JPEG モアレノイズを除去するとともに、文字部分をかなり拡大してもギザギザが目立たないように高解像度化が可能。


また、傾き補正や各ページのオフセットのズレの補正、余白部分の全体統一的なトリミング、書籍のページ番号とPDFビューアにおけるページ番号との一致、見開き表示用として左側ページと右側ページの自動判別、縦書き書籍でのページ順序 右→左にするフラグの自動設定も行えるとのこと。


「DN_SuperBook_PDF_Converter」はローカルPC上で動作し、必要システム環境はWindows 10/11(x64版)と設定されています。ただし、登氏は「Windows上で開発しましたが、C#で書かれており、原理的には、LinuxやmacOS上でも動作すると思います(それらの環境では、若干書き換えが必要と思われます)」とコメントしています。

また、RealEsrganでGPU処理を必要とするため、GPUにはNVIDIA CUDA対応でVRAM 8GB以上のGeForceシリーズが推奨されています。

なお、登氏は日本語の縦書き・横書きのいろいろな書籍を快適に読む際のお勧めPDFビューアとして、iOS/iPadOS/macOS版は「PDF Viewer by Nutrient」を、Windows版は「Sumatra PDF」を挙げています。

無料でPDF・EPUB・MOBI・CBZ・CBR・FB2・CHM・XPS・DjVu・画像を開いて読めるオープンソースのリーダーアプリ「SumatraPDF」 - GIGAZINE

この記事のタイトルとURLをコピーする

・関連記事
ブラウザにドラッグ&ドロップするだけでepubやazw3などの電子書籍ファイルを閲覧できるウェブアプリ「Ebook Reader for web」 - GIGAZINE

無料でPDF・EPUB・MOBI・CBZ・CBR・FB2・CHM・XPS・DjVu・画像を開いて読めるオープンソースのリーダーアプリ「SumatraPDF」 - GIGAZINE

わずか5万円台で誰でも簡単に毎分45枚のサクサクスキャンが可能なScanSnapのフラッグシップモデル「ScanSnap iX2500」フォト&使用レビュー - GIGAZINE

本を裁断せずA3まで見開きで取り込める非破壊スキャナ「Aura」を使ってみた - GIGAZINE

電子書籍配信サイトのランキング1位を獲得した作品はどう生み出されたのかを編集とマンガ家が明かす - GIGAZINE

in ソフトウェア, Posted by log1i_yk

You can read the machine translated English article DN_SuperBook_PDF_Converter is an AI-powe….