ビジネス書類の電子化のスキャナーの使い方

解決済

質問者：NyannyaF
質問日時：2013/03/22 03:02
回答数：4件

【質問本題】
○iPhoneでPDFで資料を持ち歩きたいので
　個人でビジネス書類をPDFで電子化したいと思っています。

　1．大量の書類を処理するのにどのようなスキャナがいいのでしょうか?
　　　大型のものは避けたいです。現在持っているのは複合機のEPSON PX-404A
　2．スキャナの時にdpiはどの程度がいいのでしょうか?
　　　書類は400dpiでOCRをかけてPDF化しています。がややファイルサイズは大きめです。
　　　文字だけなら300dpiで大丈夫でしょうが、時々画像やドットの灰色もあります。
　3．JPGで取り込むのと最初からPDFに変換しながら取り込むのとどちらがいいのでしょうか?
　　　PDFにする時の圧縮率もコツがあるのでしょうか?
　　　（JPGならiPhoneでもPDFにできますが手間が増えます。）
　4．OCRをかけるとして、Camscanner（iPhone)、複合機、専用スキャナどこで実用的になるのか?
　　　　（私は現状OCRはまだ使ってないのでよくわかっていませんのでそちらもアドバイスあれば）
　5．OCRのかけられたPDFをパソコンやiPhoneのアプリで並び替えや、結合・分割した場合に
　　　影響はあるのでしょうか?

すでに運用している方の知恵を借りれれば
もっとスマートにできると思い、質問しました。
よろしくお願いいたします。

【目的】
　紙でもらった資料をパソコンでPDFにして
　データはiPhone保存（と必要ならiPad保存とバックアップ）のみにして
　iPhoneで閲覧と編集をするようにして
　紙は捨てるつもりです。
　（データは万が一のためにクラウドは使わない→むりならクラウドには保管しないの優先）

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (4件)

No.1

回答者： yasuto07
回答日時：2013/03/22 04:38

今は、両面スキャナーがあるでしょう、私は富士通のエスシリーズですね。

ocrの意味わかりますか、、、。
pdfにするのと、ocrで、テキストかするのは意味が違いますよ、と思います。
エスシリーズなら、一発、pdfになります。私のは一分で、10枚くらい、読み込みます。
300dpiで十分だと思いますよ。pc上で、画像編集するなら、150でも、７２dpiでも、文字は読めます。

この回答への補足

回答ありがとうございます。
両面スキャナーいいですね。

しかし、裏紙コピーの取り込み時に裏写りはどのように対策してられますか?

OCRは
Optical Character Recognition の略で光学文字認識のこと。
Optical Character Reader の略で光学式文字読取装置のこと。
EPSONの複合機の「読んでここ」でもそのまま文章化は難しかったですが、
OCRで透明テキスト付けておくと大量の資料から検索が楽かな?と思います。

文字だけなら、300dpiで良かったのですが、
グラフや図形、白黒写真、パワーポイントの点で色を表現が
時々あるので皆様の工夫をアドバイスいただければと思います。

補足日時：2013/03/22 13:57

通報する

- 0
- 件

通報する

この回答へのお礼

回答ありがとうございました。

iPhone用はオリジナルを別途保管の上で
必要に応じてAcrobatで150dpiに画質を落として持ち運ぶことにしました。

ありがとうございます。

通報する

お礼日時：2013/03/26 00:14

No.2ベストアンサー

回答者： bardfish
回答日時：2013/03/22 07:13

ドキュメントスキャナというものが最適です。

定番はこれ
http://scansnap.fujitsu.com/jp/
私はScanSnap S1500を使用していますがdpi値はほぼ決められてます。迷うことはないしデフォルト値でまったく問題ありません。
スキャン時にOCR処理を行うことも可能。OCR可能かどうかは保存形式に依存。
JPEGからOCR処理をするためにはOCRソフトが必要ですが持っているのですか？

問題点は、裁断が必要ということ。
データ化した書籍は捨てるつもりなら裁断に躊躇はないでしょうが、きちんとした裁断機を買うとなると結構な値段になる。
私は裁断機は使用せず、大型のカッターナイフと定規で裁断してますけど…

ScanSnap S1500のADFは楽ですよ。
2枚以上を同時に吸い込むことは殆ど無いし、複数枚吸い込んだとしても警告表示が出て用紙をセットしなおして再開するのも簡単。
詳しく知りたければこちらを読んでください。
http://pc.watch.impress.co.jp/docs/column/ebook/ …
http://pc.watch.impress.co.jp/docs/column/ebook/ …

この回答への補足

回答ありがとうございます。
s1500いいですね。
EPSONの複合機のPDFの並べ替えが出来ない弱点と違い、
付属ソフトで対応可能ですね。
透明テキストも壊れても以下同文ですね。

OCRはiPhoneのアプリ（camscanner）です
後はスキャナの読み込み時のOCRの機能になります。

しかし、裏紙コピーの取り込み時に裏写りはどのように対策してられますか?
デフォルトでグラフや図形、白黒写真、白黒のパワーポイントの点で色を表現は
大丈夫ですか?
専用機なら自動で文字と画像を区別するのかな?
良かったらその辺りも教えてください。

補足日時：2013/03/22 14:24

通報する

- 0
- 件

通報する

この回答へのお礼

最終的に富士通のScaSnapのS1500にしました。

最新のScanSnap iX500 FI-IX500が欲しかったけど予算が足りませんでした。
どのみちバージョンの違いはあれバンドル線用品とはいえAcrobatX（IX500ならXI）
がついているので、スキャン時に
「画質の選択」
　　　スーパーファイン
「カラーモードの選択」
　　　グレー（どうでもいい書類は白黒）
「読み取り面の選択」
　　　両面
「オプション」
　　　すべてレ点をはずす。
「ファイル形式」
　　　PDF（検索可能なPDFのレ点ははずす）
「画質」
　　　最大（低圧縮）

でスキャンして、それをAcrobatのClearScanで
OCRでファイルサイズを小さくして
（必要ならオリジナルは保管の上で、モバイル用は150dpiに画質を落として)
iPhoneで運ぶことにしました。

ありがとうございました。

通報する

お礼日時：2013/03/26 00:10

No.3

回答者： shintaro-2
回答日時：2013/03/23 12:17

>EPSONの複合機のPDFの並べ替えが出来ない弱点と違い、

PDFで保存する直前に、
並べ替え、回転、削除が可能です。

この回答への補足

EPSONの複合機は保存の直前には並べ替え、回転、削除可能ですね。
確認しました。
ありがとうございます。

正確にはScanSnap S1500などAcrobat付属なら
WinPCでPDFにした後からでも並べ替え、回転、削除、結合、分割等可能
とソフト的メリットがあるですね。

これまででの理解は
　1．大量の書類を処理するのには紙送りのある専用スキャナが便利。
　2．スキャナの時にdpiはデフォルトで大丈夫らしい?
　　　→しかしiPad mini Retinaの324dpi（予定）より低い300dpiにやや不安です。
　　　　でも、ひとつ解像度をあげると600dpiと倍なのでファイルサイズも倍?
　3．JPGで取り込むより最初からPDFに変換して
　　　OCRはAcrobatでかけたほうがファイルサイズや精度で有利?
　4．OCRをかけるとして、ScanSnap OrganizerよりAcrobatXなどの方が精度が高い?
　　　その場合、Acrobatでは600dpiの1枚PDFをClearScanで処理した後、ファイル結合する?
　　　ClearScanがOCRだけでなく、まったく違う文字にならないか心配です。
　5．OCRのかけられたPDFを他のアプリでいじって問題が起きれば後でAcrobatXで透明テキストの削除と再OCRをかければよい?
　　　ClearScanが壊れないか心配。

という所です。
1以外はクエスチョンが多いのは自分で調べて追加した部分のためです。
他にあれば教えてください。
よろしくお願いいたします。

補足日時：2013/03/24 10:11

通報する

- 0
- 件

通報する

この回答へのお礼

エプソンの複合機のこと
教えてくださってありがとうございます。

教えてくださらないと誤解したままでした。

通報する

お礼日時：2013/03/26 00:15

No.4

回答者： shintaro-2
回答日時：2013/03/24 15:15

＃３です

>でも、ひとつ解像度をあげると600dpiと倍なのでファイルサイズも倍?

縦横600dpiですので、データ量としては4倍になります。

OCRをするには、文字サイズに対し適切なスキャン解像度が存在します。
大体、200～400dpiです。
フォントが5ポイント程度の場合には600dpiとかが必要な場合もあります。
ですので、誤変換を避けるのであれば、300dpi固定で良いと思います。

http://www.adobe.com/jp/joc/a9guide/tips/sakusei …

>OCRはAcrobatでかけたほうがファイルサイズや精度で有利?

AdobeのOCRよりは、読取革命の方が優秀と思います。
スキャンスナップのOCRの機能をPDFに適用するというのであれば、未検証

>4．OCRをかけるとして、ScanSnap OrganizerよりAcrobatXなどの方が精度が高い?

　怪しい

この回答への補足

長さで2倍で面積で4倍だからファイルサイズでも4倍わかりました。
現状の理解は

　1．大量の書類を処理するのには紙送りのある専用スキャナが便利。
　2．スキャナの時にdpiは300dpiで大丈夫。
　　　→ただし、iPad mini Retinaの324dpi（予定）より低い300dpiのため
　　　　将来は今のiPad Retinaで150dpiの自炊の閲覧のように妥協できる程度の綺麗さになるのは
　　　　今年の第三四半期くらいまでから確定予定。
　　　　でも、ひとつ解像度をあげると600dpiとデータサイズ4倍かつ
　　　　取り込み時間も2倍以上～4倍近くなるため現状低圧縮300dpiが妥協点。
　3．JPGで取り込むより最初からPDFに変換して
　　　　OCRはAcrobatでかけたほうがファイルサイズで有利。
　　　　しかし、OCR精度は「読取革命」の方が上。
　4．OCRをかけるとして、ScanSnap Organizer等スキャナー添付とAcrobatXはあまり変わらないかも?
　　　　Acrobatでは600dpiの1枚PDFをClearScanで処理した後、
　　　　ファイル結合するのが綺麗さ優先時にファイルサイズでベスト?
　　　　また、解像度が足りないとClearScanで線が消えたり、斜めになったりと暴走報告あり
　　　◯ClearScanがOCRだけでなく、まったく違う文字にならないか心配です。
　5．OCRのかけられたPDFを他のアプリでいじって問題が起きれば後でAcrobatXで透明テキストの削除と
　　　　再OCRをかければよい?
　　　◯ClearScanの破損が心配です。

そろそろ、Acrobatの問題になってきたようなので、
夜にはこの質問終了します。
みなさんありがとうございます。