【お題】引っかけ問題(締め切り10月27日(日)23時)

OCR機能のないスキャナで取り込んだPDFファイルが多数あります。
このPDFファイルを、OCR情報を含んだPDFファイルに変換する方法はあるのでしょうか?

要は、最初からOCR付スキャナで処理すれば良かったのですが・・・。

A 回答 (5件)

OCR機能のないスキャナの方が一般的ですが・・・


OCRソフトが付いているかいないかはあると思いますが(10年以上前のスキャナにもOCRソフトは付いていました)、PDF化できる時点でOCR情報を含んだPDFファイルを作れるはずです。
と言うのはPDFを作成するにはAdobe Acrobatは付属しているはずですが、そのAcrobat自身がOCR機能を持っています。
ただ、Acrobatのバージョンが不明ですから、どこをどうしてと言うのまでの具体的なアドバイスは出来ませんので、まずAcrobatを起動してヘルプからAcrobatヘルプでOCRを検索してみてください。
やり方が必ず書いてあるはずです。
    • good
    • 2

スキャナーとOCRは、まったく別のものです。


スキャナーは「画像の実物」を「画像ファイル」として取り込む「機械」です。
OCRは「画像ファイルの文字」を「文書ファイル」に変換する「ソフト」です。
スキャナーを買うと、OCRがオマケとして付いてきます。このOCRでも、けっこう用が足ります。
しかし、pdfファイルは「画像と文書を合成したファイル」ですから、OCRによっては、そのままスンナリと文書になりません。例えば、e.Typistなら、pdfに対応しています。
    • good
    • 1

ソフトを使えば可能です。


ソフトはたくさんあります。
安いものですとOCRの検知率が悪いので予算にあったソフトの購入を
お勧めします。
    • good
    • 5

市販ソフトの機能に明るくないのにすみません。



イマイチ「OCR情報」って何だか理解できてません。

> 変換する方法はあるのでしょうか?
古い知識での方法ならあります。
PDFファイル作成の手順からして、PDF 内部の情報はビットイメージらしいのでそれ前提で。

1. PDF ファイル内容を画面に表示し、PrintScreen などを使い「ビットイメージファイル化」します。
後述のOCRソフトによってはファイル化せず「コピペ」でも済むかも。
2. OCR ソフトに読ませ文字コードに変換「テキスト化」させます。
3. これをページ数分繰り返します。
4. 複数ページの「テキスト」をまとめて1ファイルPDF化します。

図を含む場合はOCRの邪魔なので「そこは文字じゃないよ」指定するといいです。

以上の手順を、自動化したソフトが存在するのか、は知りません。
    • good
    • 1

OCRソフトが売っていれば出来ると思いますよ。


んでそれをPDFにするにはアクロバットがあればPDFに変換出来ると思いますが・・・。
チョット最近のソフト事情が判らないモンでこの辺で。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報