プロが教えるわが家の防犯対策術!

Adobe Acrobat 7.0 Standard についての質問です。

シートフィーダー付のスキャナーで取り込んだマルチページTIFF画像(1)(白黒2値,600dpi A4,CCITT Group4圧縮)を、Adobe Acrobat 7.0 Standard で 設定を [環境設定-PDFへの変換-TIFF-白黒圧縮-JBIG2(劣化あり)]で読み込み、PDF形式で保存(2)すると、元のマルチページTIFFファイルと比較して容量が2/3くらいになります。

このPDFファイルの全ページを、OCRを使用してテキストとして認識[設定 言語:日本語-PDFの出力形式:検索可能な画像(非圧縮)-ダウンサンプリング:最低(600dpi)]の処理をした後に、保存しなおす(3)と、元のマルチページTIFFファイルと比較して容量が1/3~1/5くらいになるにもかかわらず、最初のPDFファイルから画像の劣化は全くありません(見分けがつきません)。

具体的にいうと、A4白黒10ページのある文書の場合、
(1)マルチページTIFF(白黒2値,600dpi A4,CCITT Group4圧縮): 1575 KB
(2)PDF-無処理(JBIG2劣化あり): 1014 KB
(3)PDF-OCR処理(圧縮??): 431 KB

ここで2つ質問があるのですが、
I. (1)から(2)で容量が減少するのはJBIG2圧縮のおかげだと思うのですが、(2)から(3)で容量が減少するのはなぜなのでしょうか?
II. また、マルチページTIFFをPDFに変換する際、OCR処理を経ずに(2)から(3)のような圧縮?を実現することは出来ないでしょうか?(ダウンサンプリングは無しで)

全ページのOCR処理はすごく時間がかかるのですが、現状では、ファイルの容量を減らすために仕方なく実施しています。
また、マルチページTIFFをスタートにしなくても構わないので、紙の白黒書類を上記と同等以上に圧縮してPDFとする方法をご存知でしたら、ご教授願います。

よろしくお願いします。

A 回答 (1件)

OCR処理に就いては詳細は不明ですので適切なお答えは出来ませんが。


以前した時は『白/黒 2値』で取得しています。
OCR処理ソフト等は『白/黒 2値』で取得して変換していますね。
却ってカラー情報、グレースケール情報が有るとOCRソフトでテキスト
変換した時に誤認識しました。
    • good
    • 0
この回答へのお礼

ありがとうございました。

しかし、OCR処理における画像圧縮に関して知りたいので、
回答の募集は継続させていただきます。

お礼日時:2006/10/16 12:37

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!