10秒目をつむったら…

よろしくお願い致します。

PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか?
卒業文集の文章を、ブラザーの複合機でスキャンしpdfにしました。
それを変換ソフトを使って(変換中ocrと表示されます)ワードやエクセルにすると
文字化けしてしまいます。

どうにか文字化けしないようにするにはどうしたら良いでしょうか?
ご教授下さいませ。

A 回答 (2件)

>PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか?



何故でしょうって、そりゃOCRの宿命だから。

紙に印刷された白黒のパターンをもとに、何千字という辞書から正しいと考えられる文字を探すんですよ。
一文字も間違わない方が、むしろ不思議です。


もともとbrotherの添付ソフトであるプレストのOCRは認識率が低いです。


とりあえず、そんなに小さな字でなければ解像度を300-400dpiで固定し
原稿濃度を濃くしたり薄くしてスキャンして、一番認識率が高い(誤認識:文字化けの少ない)
コンディションを探してください。

きれいな原稿を用意するのも、認識率を高める一つの手です。
    • good
    • 0
この回答へのお礼

ご教授ありがとうございました。
OCRとはそのようになっているんですね・・・
勉強になりました。

本当にありがとうございました。

お礼日時:2012/09/06 09:22

それは「文字化け」とはいいません、「誤認識」といいます。


つまりパソコンが読み違えているだけ・・・
    
OCRソフトの宿命です。
対策は・・・
読み込んだ画像の明暗、濃度などの調整、OCRソフトの読み取り精度などで、多少は良くなるかも?
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報