日々のコンピュータ情報の集積と整理

Dr.ウーパのコンピュータ備忘録

2015年1月15日木曜日

ScanSnap:スキャンし忘れたと思っていた本が、他の本のPDFの後ろについていた

イントロダクション

ScanSnap S1500を使用して、大量の本を電子化(PDF)し、タブレット端末で読書を楽しんでいます。



わたしの自炊(書籍の電子化)環境 - Dr.ウーパのコンピュータ備忘録
http://upa-pc.blogspot.com/2012/11/blog-post.html


さて、大量の本を電子化していると、どうしても発生してしまうのが作業ミスです。
何しろ、量がたくさんあるので、1つ1つの作業への注意がどうしても疎かになってしまうことがあります。

その作業ミスの一つに「本ごとに PDF ファイルを作成するはずが、2冊の本をまとめて1つの PDF ファイルにしていた」という事例です。

2冊の本を1つのPDFファイルにまとめてしまった
2冊の本を1つのPDFファイルにまとめてしまった


前提となるScanSnap S1500の設定

この話の前提として、ScanSnap S1500 の設定は、PDF 形式でスキャンしたデータを保存するものとします。

本を1冊連続で電子書籍としてみる場合、PDF 形式であれば、1つのファイルとして複数のページをまとめられるため、非常に読みやすいです。

本を画像ファイルとして電子化した場合 ページごとに画像ファイル1つと対応するため、 大量の画像ファイルが生成されてしまう
本を画像ファイルとして電子化した場合
ページごとに画像ファイル1つと対応するため、
大量の画像ファイルが生成されてしまう

PDF ファイルの場合、複数のページを1つのファイル内に格納できる
PDF ファイルの場合、複数のページを1つのファイル内に格納できる


本ごとに PDF ファイルを作成するはずが、2冊の本をまとめて1つの PDF ファイルにしていた

本を読み込むときの基本的な動作

本を電子化する場合、1冊の本ごとに1つのPDFファイルとして保存すると、1冊の本と1つのファイルが対応するため、そのあとに電子書籍として読み返す時に非常に扱いやすいです。

そのため、1冊の本1つのPDFファイルとして保存しています。

1冊の本を1つのPDFファイルと対応させる
1冊の本を1つのPDFファイルと対応させる


そのような形の読み取りを ScanSnap S1500で実現する場合、最も手軽なのが読み取り設定にて、読み取りモードの「継続読み取りを有効にします」にチェックを入れて本をスキャンすることです。

ScanSnap 読み取り設定 読み取りモード→「継続読み取りを有効にします」にチェックを入れる
ScanSnap 読み取り設定
読み取りモード→「継続読み取りを有効にします」にチェックを入れる


「継続読み取りを有効にします」にチェックを入れてあると、ScanSnap S1500 にセットした読み取り対象の本のページが全て取り込み終わった後に、次のようなダイアログが表示されます

「ScanSnap Manager - イメージ読み取りとファイル保存」ダイアログ 継続読み取りを行うか、読み取りを終了するか選択できる
「ScanSnap Manager - イメージ読み取りとファイル保存」ダイアログ
継続読み取りを行うか、読み取りを終了するか選択できる


この「ScanSnap Manager - イメージ読み取りとファイル保存」ダイアログにて、今まで読み込んだページの後に、これから読み込む本のページを続けるかどうかを選択できます。

「継続読み取り」ボタンを押すことで、ScanSnap S1500に新しくセットしたページを、いままでに読み込んだページの後に続けることができます。

「読み取り終了」ボタンを押すことで、今まで読み込んだページを、1つのPDFファイルとして保存することができます。


ScanSnap S1500 に一度にセットできるページの枚数には制限があります。

そのため、薄い本であれば一度に1冊丸ごとスキャンできるものでも、専門書のような分厚い本では、何度かに分けてスキャンを行わなければなりません。


その時に、上記の「継続読み取り」機能を使用します。


失敗事例

おそらく、一度に何冊も本を読み込んでいて、疲れていたのでしょう。

本来は 1 冊の本を取り込み終わったら、「読み取り終了」ボタンを押して、1つのPDFファイルとして保存してから、次の本の取り込みを開始します。


ところが、「読み取り終了」ボタンを押さずに、次の本の取り込みをはじめてしまったのでしょう。


ある本を電子化したPDFファイルを開いてみたところ、その本の最終ページの次に別の本がまるまるつながっていました

本Aの最後のページの後に、本Bの最初のページが続く(イメージ図)
本Aの最後のページの後に、本Bの最初のページが続く(イメージ図)


その本は電子化し忘れて、破棄してしまったとばかり思っていた本でした。
(専門書が多いので、1冊あたり数千円するので結構な痛手です。)

それを見つけた時、うれしさのあまりガッツポーズをとってしまいました。


データさえ見つかれば、1 つの PDF ファイルにすることは簡単です。

2 冊の本が合わさって 1 つの PDF ファイルになっているものを分離し、1 冊の本のデータのみが含まれる 2 つのPDF ファイルに分離しました。


ミスの原因となった要因

基本的に、ScanSnap S1500で本の取り込みを行う場合には、本体の「Scan」ボタンを押すようにしています。

ScanSnap S1500 のScanボタン
ScanSnap S1500 のScanボタン


わざわざマウスで、ダイアログに表示された「継続読み取り」ボタンや、タスクトレイのScanSnapのアイコンの右クリックメニューから「両面読み取り」をクリックするようなことはしていません。


明らかに本体の「Scan」ボタンを押す方が、手軽に素早く操作できるからです。


そのため、新規に本をスキャンし始める操作と、本の続きからスキャンし始める操作が、同じ「本体の「Scan」ボタンを押す」という操作になっていました。

これが、ミスを生む要因となったのだと思います。


とはいえ、ScanSnapの本体のScanボタンではなく、パソコン上のソフトウェアでスキャンを開始するのは上記に記載したように手間がかかります。

データさえあれば、2冊の本がつながって1つのPDFファイルになっていても分離することは容易なので、このミスを発生させたとしても、こういうミスがあるということさえ認識していれば、ミスをリカバーするのは容易です。

そのため、わざわざ本を新規にスキャンするときの操作と、継続読み取りするときの動作を異なる手順で行いミスの発生を防止するよりも、ミスを発生させてしまったらそのあとにリカバーするようにした方が、トータルでは効率が良さそうです。
(ミスの発生頻度にもよります。ミスの発生頻度が多いようであれば、対策として作業手順の改善を考える必要がありそうです。)


もしかしたら、同じようなミスをしているかも?

スキャンし終わった後にスキャンしたはずの本が見当たらなかったら、まずはその本に含まれるワードで今までスキャンした本を検索してみてください。
(スキャンした本に対して、OCRで文字情報を付与している場合)

もしかしたら、1冊の本の続きに別の本が連続しているかもしれません。






関連記事

関連記事を読み込み中...

同じラベルの記事を読み込み中...