ちょっと前にkinko’sで蔵書をスキャンして処分した話(kinko’sで自炊(電子書籍化)にチャレンジしてみた)を書いてみたんですが、忙しすぎて肝心のPDFにするところが書けてませんでした。というわけでサラッとやってみたことをまとめておこうかなと。
PDFにする前の下準備
前回、画像一括編集ソフト(Xn Convert)で編集した画像がこちら↓。一括変換で下準備済みです。
画像からPDFを生成するにはMacならデフォルトのプレビュー書き出し、ScanSnapシリーズのスキャナをお持ちの方はPDF編集ソフトなんかも選択肢としてはありますが、画像補正やファイルサイズの圧縮機能を使いたかったので、今回はAdobeのAcrobatを使っていくことにします。ちなみに僕はデザインソフトのAdobe PhotoshopやIllustrator、Premier、Auditionなどもろもろのアプリケーションを業務でも使っているので、Creative Cloudという定額制のサービスに入っています。
AcrobatでPDFに結合
まずはAcrobatを立ち上げ、ツールから「ファイルを結合」を選択すると、ここにファイルをドラッグ&ドロップしてくださいという画面が表示されるので、結合したい画像を一気に放り込みます。このときファイル名がページ順になっていることがポイント。例えば「page_001.jpg」とかでも良いし、スキャン日時「2020年03月01日.jpg」とかでも構いません。稀にファイル名でページが前後するときもあるので、チェックは念入りにしておいた方が良いかも。
どさっと放り込むと、画像一覧が表示されるので、右上にある結合ボタンを押すと順番に結合されてひとつのファイルになっていきます。
結合が終わると完成したPDFが表示されます。Macのプレビューで確認しても、ちゃんとPDFになっている模様。容量としては、この状態で120MBぐらいありました。
容量がとくに問題ない方はこのまま保存しても良いかもですが、自分の場合このレベルを超える書籍群が全部で200以上あるため、ファイルサイズの圧縮と合わせてOCR処理(検索できるようにテキスト情報を埋め込んでおくこと)しておこうかなと思います。
PDFを最適化=検索できるようOCR処理&画像圧縮
方法はAcrobatでそのままできるので簡単。ツールタブから「スキャンとOCR」を選択、上部のメニューから「補正」を選択。補正の設定画面からオプションをポチポチ選んでいきます。今回はスキャン時に斜めにスキャンしてしまった原稿を補正したかったので、「ゆがみ補正」をオンにしつつ、フィルターを少し調整。あとテキスト認識をONにしてOCR処理することに。
完成したPDFのスクリーンショットを撮影してみました。そもそもJPG画像にする時点で劣化しているわけですが、まあ参考までに。Acrobatのオプションでテキストシャープニング低を入れたおかげで、元画像よりもちょっと読みやすい感じにはなった気がします。
PDF化した蔵書の今後の運用方針
自分でスキャンした書籍は12冊あるのですが、今後は自炊代行業者にお願いした250冊分と合わせてDropboxに入れて保管する予定。さらにEvernoteのなかに入れてしまおうかなと考えています。Evernoteはプレミアムプランでかなりのファイルを置いておけるし、何よりスマホアプリでも閲覧可能。ちょっとしたアイデアや、気になった単語なんかをEvernoteのスマホアプリで検索すれば、関連する書籍と該当箇所が一発で分かるという。200冊以上をポケットに入れて持ち歩いてると思えば、断裁した罪悪感も少しぐらい薄れてくれるかもしれません。