重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

電子書籍の厳選無料作品が豊富!

こんにちは。
仕事に使う書籍が多くなってきたため、書籍を電子化しています。
裁断し、文書スキャナ(canonDR-150)でひたすら取り込み大雑把にフォルダに分類しているのですが、電子化のやり方などを読むと「OCRソフトを使って」という記載が見られます。OCRの意味がもう一つよくわからないのですが、使うとなにが利点なのでしょうか。後で検索したりしようと思うのですが、そのときに困るのでしょうか。

今は編集ソフトPDF-XChange4Proを購入して使用しています。(PDF関連付けもPDF-Xchangeになっています。)あまり不自由がないので、もしかしてこれはすでにOCRというものを使っているのでしょうか?
なんかスッキリしないので質問しました。よろしくお願いします。

A 回答 (3件)

OCRとはPDFデータにある文書を、テキスト文書のように認識させることです。


そうしておくと、PDF内の単語や語句を、txtやwordファイルのように検索できます。
調べ物に必要な本を電子化した場合、探している語句を検索すれば一発で探せるので便利です。
OCR化していないと、PDFデータ基本、画像データのように扱われ、文章検索ができません。

文字検索が出来るPDFになっていればOCR化されています。
検索できなければOCR化されていないということです。

ただOCR昨日自体が完璧に認識してくれるわけではないので
全文が正しく検索できるとは限りません。
    • good
    • 0
この回答へのお礼

今やってみましたら、文字検索できました。
OCR化されていたのですね。

また何かしないといけないかと思っていたので、気が楽になりました。

ありがとうございました。

お礼日時:2013/01/29 16:22

 OCRというのはoptical character recognition(光学文字認識)の略称で、活字に印刷された文字をテキストデータに変換する技術の事です。



 OCRソフトを使うと、活字印刷された文章をテキストデータに変換出来るので、データ量が大幅に減り、ワープロソフトなどを使って編集出来るようになります。

 もっとも、活字以外の文章ではOCRは使いものになりません。手書き文字では認識出来ない例が多いからです。

 OCRを使って読み込めるのは活字の印字品質が良い場合だけで、そうでない場合は誤認識が多くなって失敗する例が多いようです。

 大量の情報を保存出来るHDD、BD、USBメモリーが普及した現在では、画像データ(PDF)として読み込む方が失敗が少ないですね。編集出来ませんし、データ量も増えますが、一般的なように思います。

 OCRによる書籍の電子化は、単行本のように絵や写真が入っていない文章だけの出版物の場合に有効ですが、画像のまま保存するPDFの方が多いのではないでしょうか。

参考URL:http://ja.wikipedia.org/wiki/%E5%85%89%E5%AD%A6% …
    • good
    • 0
この回答へのお礼

OCRはテキストデータに変換され、データ量が減るという利点もあったのですね。
でもおっしゃるように、HDDも大容量ですしこのままでいいかと思えてきました。

続けて回答いただき、知識が増えました。
ありがとうございました。

お礼日時:2013/01/29 16:38

OCRは文字読み取りソフトです。


おっしゃっているようにあとで検索ができるようになります。

原本は捨てちゃうわけですから、バックアップはきっちり取って
なくなってしまわないようにしましょう。w
    • good
    • 0
この回答へのお礼

さっそくにありがとうございます。
検索は、あまり重視していないのでこのままでいいように思えてきました。

バックアップ必要ですね。一段落したらと思っていたのですが、怖くなってきたのでちょくちょくとるようにします。
ありがとうございました。

お礼日時:2013/01/29 16:13

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!