アプリ版:「スタンプのみでお礼する」機能のリリースについて

ワード等で作成した文書などをスキャナでPDF化するという物凄く単純なことは自分でも出来ますが、一度PDF化したものを元に戻すというのは難しいのでしょうか?最低限テキストデータだけでも元のデータに復元することは可能なのでしょうか?それともPDFとはあくまで画像データの一種でありテキスト等への変換は不可能でしょうか。そもそも画像データはテキストに出来ないのでしょうか。ソフトがあれば可能と聞いた気もするのですが。

A 回答 (2件)

>ワード等で作成した文書などをスキャナでPDF化する



 通常はワードなどから直接PDFに変換します。その方法だと見た目はPDFのデータでも内容は単なる画像データとなってしまうので、単語の検索などが出来なくなります。

 PDFからワードなどのファイル形式に変換するにはいくつかの方法があります。

1.Adobe Acrobatの書き出し機能でワードに変換する。
2.変換用のソフトを使う。
3.一旦印刷したものをスキャナで読み込み、OCRソフトでテキスト化する。

 1の方法は元になるPDFがワードなどから直接変換されたものであることが条件です。スキャナで読み込んだものは画像データとなっているので文字認識が出来ず、変換できません。又、そうでなくてもうまく変換できないことが多いです。
 2の方法も同様です。ただ、そういったソフトの場合、OCR機能を応用しているものが多いですから、うまくいく場合もあります。ただし、そのようなソフトだと誤変換も多いです。きちんと文字認識して変換するタイプは誤変換が少ないです(その分高価)。
 3の方法は一番遠回りなやり方で、誤変換もし易いでしょう。

 2の方法を採る場合、変換率が最も高いとされているのは下記のソフトです。

http://www.antenna.co.jp/rpd/
    • good
    • 0
この回答へのお礼

早速どうも有り難う御座いました。ただ確実にコレというのは難しいのですね。ご紹介頂いたものをためしてみます。

お礼日時:2008/03/26 23:26

PDFファイルをWord形式に変換 リッチテキストPDF(有償ソフト)


http://trendy.nikkeibp.co.jp/article/col/2005071 …

と言うソフトがありました。google等で検索すれば他にも
ソフトがあるかもしれません。

写真で文章を写したような文章が画像ファイルになっている
場合は、OCRと言うソフトを使ってテキスト形式に抽出する
作業が必要になります。

PDF OCRで検索した所、
http://www.google.co.jp/search?hl=ja&q=pdf+ocr&lr=

無料でPDFのOCR「クセロReader ZERO」
http://www.moongift.jp/2007/11/xelo_reader_zero/

と言うソフトがありました。このクセロReader ZEROを使って
文章をプレーンテキストに変換すれば、文字データとして
使えると思います。
    • good
    • 0
この回答へのお礼

こちらもご丁寧に有難う御座います。試してみます。

お礼日時:2008/03/26 23:27

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!