誕生日にもらった意外なもの

ワード・エクセルで作成した用紙を スキャナーで読みとり、その用紙をパソコン上で 編集したいです。何か良い方法はないでしょうか? 宜しくお願いします。

A 回答 (2件)

 OCRソフトを用いれば可能です。

認識の結果をワードやエクセルに転送することもできる場合もありますし、結果をPDFに出力できるものもあります。逆にPDFからの読み込みをサポートするものもあるようです。

 手持ちの単体で販売されているOCRソフト(1万円くらいのもの)で試してみました。原稿はエクセルで作りランダマイズ関数で6桁の整数をランダムに発生させ横8個ほど、縦10個ほどならべ中太の罫線で表にし、整数は3桁の位取りのコンマありで、縦計、横計を表の下と右に設置しました。フォントはOCRフォント(OCRB)、大きさは12ポイントほどに設定。印刷はPM-900Cの精細モードを使いエプソン上質紙に印刷しました。スキャナーはちょっと古いのですがシャープJX350の400DPI、OCRソフトは製品版2種類で試しました。現行バージョンではなく一つ前くらいのものです。

 読み込みに関しては原稿の傾きの自動検出が働かないように最初から完全な正立の状態で、文字種は数字と記号に固定しました。原稿は数枚用意しそれぞれ2,3回読み込ませて試しました。

 その結果ですが、満足できるものではありませんでした。読み込ませたデータだけを再度エクセルに読み込ませその結果を足しあわせてみましたが、合計が原稿とあった行、列は一つもありませんでした。

 誤認識率が例えば1%だとすると、先ほどの例では7文字×8列×10段(7としたのは位取りのコンマを含むからです)で560文字が全体の数ですので数個の誤認識ということになりますが、何度試してもそれよりもはるかに悪い数字でした。

 特徴的なのはコンマとピリオド、罫線と数字の"1"の文字の間違いが多かった様です。

 ワードの印刷物に関してもエクセルほど悪くはありませんでしたが、やはり誤認識は1%ほど認められました。同じことを新聞の記事(800文字程度のコラム)の切り抜きで行ったところ、どういうわけか誤認識は一字もありませんでした。

 実際には誤認識辞書などソフトについている機能を最大限用いれば結果は大きく改善されるものと想像できます。ただ原稿との精細な照合は最大限気をつけて行った方がよいでしょう。ソフトに原稿の傾き補正機能があっても、それが働かないように原稿は傾きのないようにスキャナーに置くと認識率が上がるようです。

 もちろんこれは私の劣悪な機材や多くのソフトや周辺機器がつないでいる状態での実験ですのでお使いの条件とは違うと思いますが、もし原稿がお手元にあってスキャナーをお持ちならこのような実験を試用版をダウンロードして実際にお試しになってはどうでしょうか。

 試用版がダウンロードできるソフトとしては一例として「読んでココ」とか「読取革命」があります。
http://ai2you.com/ocr/guide/experience.asp
http://panasonic.co.jp/pss/pstc/products/yomikak …
    • good
    • 0
この回答へのお礼

有難うございました。参考になりました。

お礼日時:2004/06/10 10:59

高解像度タイプのスキャナーを購入すると大抵の場合,試用版などでOCRソフトがついてきます。


罫線や飾り文字でなければ、それで読み取り編集できます。
勿論、市販でもOCRは販売しています。
また、エクセルなどの表についても表専用のOCRが市販されています。
それらを使えば、読み取り編集可能です。(ただしエクセルなどの場合、当然ですが関数などは、反映されません)
    • good
    • 0
この回答へのお礼

有難うございます。

お礼日時:2004/06/10 10:56

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!