重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

電子書籍の厳選無料作品が豊富!

長さがA0サイズ(1200mm)以上のTIF画像をOCR化し、PDF上で文字検索できるようにしたいです。(Acrobatの標準機能では最大で約1145mmまでしか対応していません。)

なにか方法があれば教えてください。

A 回答 (4件)

分割はできないとありますが、Acrobat proをご使用でしたらできます。


とりあえず全体のPDFは作成されているのでしょうから、”Ctrl+Shift+T”でトリミングする。
文書→ページのトリミング
このとき、長いものはOCRできる長さにすれば、OCRすればOKです。(経験済み)
これを異なるファイル名で保存し、2枚(長さによってはn枚に分割)に分割したファイルと全体のファイルを文書結合すれば、3ページのファイルにはなりますが、可能かと思います。
    • good
    • 0

#2です。



事情がよくわかりません。

>で、(2)の拡大した時点でOCRの情報がなくなります

PDFにするのはOCRが目的でしょうから、縮小してOCRが可能ならそのままで良いのではないでしょうか?
#2の(1)にも書きましたが、プリント用にはオリジナルのTIFFを利用すれば良いでしょうし、PDFからでも縮小版はプリント可能ですし、ディスプレイ表示では拡大・縮小可能なので問題ないと想像しますが?


1mを超えるような出力をプリントをする時には、アウトプットを何らかの形で使うことを目的にしているのでしょうから、その時はプリント用のファイルを用いることでも良いのではないでしょうか。
もっとも、プリンタ側に縮小・拡大プリントの機能があれば、縮小したとは言えデータ密度は落ちていないので、縮小PDFからでも拡大プリントによって、ほとんど同じ精度での原寸プリントが可能だと思いますけれど…
    • good
    • 0

TIFFもPDFもよくわかってはいませんが…




条件がわかってないので、Acrobatの制限が1145mmというサイズだけであると仮定して。

例えば、サイズを変えても良いのなら
(1)TIFFの解像度を2倍にすれば情報量を変えずに、サイズを半分に
  できますのでそのままOCR可能ではないでしょうか?
  (出力などには、TIFFの元データを使用すれば良い)

あるいは、少しの差なので
(2)制限の1145mmに入るように縮小して(約95%くらいか?)
  擬似的に近いサイズでPDF化する。
  ((1)同様に解像度で調整するか、データを変更てしまう。
   (変更すると、多分情報量が落ちます))

OCRだけが目的なら
(3)画像の2/3くらいずつに分割して、別ページにしてPDF化する。


わかってないで、思いつく方法はこれくらいでしょうか。
ほかにも制限があるとダメなのかもしれませんが。
PDFのOCRが、どれだけあてになるのかもわかりませんけれど。

この回答への補足

回答ありがとうございます。

いろいろと説明不足で申し訳ありません。

(1)、(2)の方法は試したのですが、問題がありまして。。
最終的なTIFサイズは変えたくないので、
 (1) TIF画像を縮小してOCR
 (2) 拡大して元サイズに
で、(2)の拡大した時点でOCRの情報がなくなります。

(3)は分割自体ができないないようなので。。

ちなみに2mくらいのサイズのTIFもあります。

補足日時:2012/02/01 16:58
    • good
    • 0

焼き魚に100円ライターを合体させたいです、何か方法はありますか?という質問と同じですね。

(^_^;

OCR化というのがまず間違っています。

データからテキストデータを抜き出してそれをパソコンで読めるように、また文字認識させるのがOCRです、OCR化とは言いません。

言わない物を検索できるようにする、というのも無理な話です。

この回答への補足

表現が間違っていて申し訳ありあせん。

正確に言いますと、A0サイズ超のTIF画像を透明テキスト付PDFに変換したいということです。

補足日時:2012/02/01 17:01
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!