
こんにちは。
仕事に使う書籍が多くなってきたため、書籍を電子化しています。
裁断し、文書スキャナ(canonDR-150)でひたすら取り込み大雑把にフォルダに分類しているのですが、電子化のやり方などを読むと「OCRソフトを使って」という記載が見られます。OCRの意味がもう一つよくわからないのですが、使うとなにが利点なのでしょうか。後で検索したりしようと思うのですが、そのときに困るのでしょうか。
今は編集ソフトPDF-XChange4Proを購入して使用しています。(PDF関連付けもPDF-Xchangeになっています。)あまり不自由がないので、もしかしてこれはすでにOCRというものを使っているのでしょうか?
なんかスッキリしないので質問しました。よろしくお願いします。
No.2ベストアンサー
- 回答日時:
OCRとはPDFデータにある文書を、テキスト文書のように認識させることです。
そうしておくと、PDF内の単語や語句を、txtやwordファイルのように検索できます。
調べ物に必要な本を電子化した場合、探している語句を検索すれば一発で探せるので便利です。
OCR化していないと、PDFデータ基本、画像データのように扱われ、文章検索ができません。
文字検索が出来るPDFになっていればOCR化されています。
検索できなければOCR化されていないということです。
ただOCR昨日自体が完璧に認識してくれるわけではないので
全文が正しく検索できるとは限りません。
今やってみましたら、文字検索できました。
OCR化されていたのですね。
また何かしないといけないかと思っていたので、気が楽になりました。
ありがとうございました。
No.3
- 回答日時:
OCRというのはoptical character recognition(光学文字認識)の略称で、活字に印刷された文字をテキストデータに変換する技術の事です。
OCRソフトを使うと、活字印刷された文章をテキストデータに変換出来るので、データ量が大幅に減り、ワープロソフトなどを使って編集出来るようになります。
もっとも、活字以外の文章ではOCRは使いものになりません。手書き文字では認識出来ない例が多いからです。
OCRを使って読み込めるのは活字の印字品質が良い場合だけで、そうでない場合は誤認識が多くなって失敗する例が多いようです。
大量の情報を保存出来るHDD、BD、USBメモリーが普及した現在では、画像データ(PDF)として読み込む方が失敗が少ないですね。編集出来ませんし、データ量も増えますが、一般的なように思います。
OCRによる書籍の電子化は、単行本のように絵や写真が入っていない文章だけの出版物の場合に有効ですが、画像のまま保存するPDFの方が多いのではないでしょうか。
参考URL:http://ja.wikipedia.org/wiki/%E5%85%89%E5%AD%A6% …
OCRはテキストデータに変換され、データ量が減るという利点もあったのですね。
でもおっしゃるように、HDDも大容量ですしこのままでいいかと思えてきました。
続けて回答いただき、知識が増えました。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 確定申告 住宅ローン控除 e-taxソフトでの申請について 2 2023/01/21 20:05
- 電子書籍 PDFの電子書籍化 3 2022/12/31 16:27
- 電子書籍 決済アプリについて教えて下さい。 1 2022/11/06 10:02
- タブレット アマゾンプライムデーで10インチのタブレットを安く購入しようと思ってますが・・・? 1 2022/07/11 19:41
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- タブレット 中古iPadか格安タブレットか 2 2022/08/23 15:40
- その他(買い物・ショッピング) 「Amazon電子書籍「kindie」について」 Amazon電子書籍「kindle」アプリをインス 3 2023/04/06 12:27
- その他(読書) 出版社に要望の手紙を送りたい。 3 2023/02/12 14:29
- PDF Adobe Acrobat DCでは複数のPDFをOCR化できますか? 2 2022/04/19 15:25
- PDF PDFに直接✓とサインを記入したい 1 2022/04/07 10:46
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Photoshopのアカデミック版の購入
-
IDマネージャーの設定
-
epsがステカのCutStudioで読み...
-
iTunesでオーディオCDを作成し...
-
USBメモリーに初めから入ってい...
-
HDD丸ごと暗号化して、アク...
-
2色刷りについて
-
iTunesでCD情報が取得できない
-
書籍の電子化について
-
IllustratorとPhotoshopの使い分け
-
Drag'n Drop CD+DVDの一時保存...
-
Macのミュージックデータの格納...
-
Outlook予定表のデータ格納フォ...
-
shadeの素材集で変形可能な人の...
-
1時間の映像をDVDに焼く時間は...
-
画像のRGBを自動で記録するソフ...
-
PDFのデータに文字入力したい
-
地図ソフトを探しています!!!
-
Outlook: 会社と家の...
-
ホームページ作成ソフトNinja 9...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
USBメモリーに初めから入ってい...
-
1時間の映像をDVDに焼く時間は...
-
測量計算システム「TryPod」の...
-
VisualStudio のデータブレーク...
-
Excel2010 貼り付け グレーアウト
-
G.Crewはなぜ使われないんでし...
-
Illustratorのデータを人に渡す...
-
MIDIで、複数のパートを一つに...
-
CMYKの合計(濃度?)を下げる...
-
エミュレータについて
-
DVDを焼くソフトは何がおすすめ...
-
コピーガードについて
-
ID ManagerにおけるFTPサイトの...
-
筆王でシステムで予約されてい...
-
電気設備関係のCADデータを探し...
-
Macのミュージックデータの格納...
-
isoイメージファイルを焼くとD...
-
音楽データなんかを軽くする方法
-
MIDIのファイルサイズを小さく…
-
動画と静止画像を同じDVD、...
おすすめ情報