電子書籍の厳選無料作品が豊富!

紙の文書(雑誌や本をコピーしたものなど)を家庭のPC上(WindowsXP、OE6)で編集したり、別の言語に翻訳したりしたいのですが、簡単かつ安価な方法はありませんか?

「最近のスキャナーは安い機種でもOCRがついていて、かなりの精度で読み込めるらしい」という情報を得たのですが本当でしょうか。「安い」とは、また「かなりの精度」とはどの程度なのでしょうか。図などは一切取り込む必要がなく、文字が9割がた読めさえすればいいのですが。

(すみません、検索したのですが、よくわかりませんでした。また、当方、PCオンチなので、わかりやす~く説明していただけると助かります)

A 回答 (5件)

私は使い物になると思います。


まずOCR目的での取り込みの解像度は400dpi以上が目安なので、
キヤノンでもEPSONでもスキャナは一番下のモデルでも十分です。

どちらを買っても、バンドル版のOCRソフトが付属しています。
バンドル版は、通常の製品と比べると機能が制限されていて
十分使い物になるかはわかりません。
(私はバンドル版を使ったことがない)
一度使ってみて、製品版の購入を検討すればよいと思います。
体験版があるので試すこともできます。
製品版は2万円位、ダウンロード版にすれば少し安いし、
スキャナ付属ソフトに対してのアップグレード版を買えば
6000円位です。凝った文字(斜体とか)でなく一般的な字体なら
9割以上楽にクリアすると思いますけどね。
レイアウト崩れは、気にすることないと思います。
必要な所だけ範囲指定し認識すればよいだけです。
http://pac.mediadrive.jp/et/index.html
http://ai2you.com/ocr/
http://panasonic.co.jp/pss/pstc/products/yomikak …
    • good
    • 0
この回答へのお礼

あれから、業者の文書電子化サービスを利用するという手もあるなと思ったのですが、今朝、ご回答を参考に、量販店に問い合わせたところ、1万円強で、解像度も十分でコンパクトなスキャナが出回っていると確認できました。やはり1台購入したほうが何かと便利でお得ではないかと考えています。しかし、斜体字はクセモノなのですね。検討してみます。ありがとうございました。リンクも助かります。

お礼日時:2006/03/08 11:23

他の方が「読んでココ」の使い方を質問してますので



http://oshiete1.goo.ne.jp/kotaeru.php3?q=2013479

この手順でお試しください。
PDFファイルを読み込んで、領域(文字の段落)を決めて、最後に認識させます。
そして認識された文章をWordやExcelなどに書き出すという手順になります。
体験版でも手順は同様と思います。

この回答への補足

皆さんからいただいた回答をもとに試行錯誤しているうちに、大変遅くなってしまいましたが、締め切ります。これに際して、一番上の「補足」欄を拝借して改めてお礼申し上げます。

結局、いただいたリンクの中では「読取革命」がかなり正確だったので、今度、必要が生じたときにスキャナーを買おうと思います。(評判のいい「読んdeココ」は多忙の中、試行錯誤しているうちに試用期間が過ぎてしまいました)。皆さん、ありがとうございました。

補足日時:2006/03/23 15:16
    • good
    • 0
この回答へのお礼

リンクをありがとうございます。しかし何度もすみません。教えていただいたQ&Aによると、ネットで見つけたPDFファイルを、まず自分のPC内のどこか(例えばマイ・ドキュメント)に保存する必要があるわけですよね?(違います?) ネット検索で見つかるPDFファイルはどれも「名前をつけて保存」ができないのですが。

お礼日時:2006/03/08 22:03

スキャナー購入前に試したければ、OCRソフトの体験版をDLして、ネットで適当なPDFファイルやJPEGファイルに文字が入ったものを試すことで、大体の状況は判ります。


スキャナーは1万円程度のものでも十分で、製品版としてソフトを購入されてはいかがでしょうか。
ソフトにより得手不得手、特色もありますから、十分ご検討ください。
英文なら、ほぼ100%近い認識率と思います。
    • good
    • 0
この回答へのお礼

ご回答をありがとうございました。スキャナ購入前でも感触をつかめるのですね。大変お手数なのですが、PC知識が赤店状態の私にも分かるように「ネットで適当なPDFファイルやJPEGファイルに文字が入ったものを試す」というあたりを、わかりやす~く解説していただけないでしょうか。OCRソフトの体験版はダウンロードしました。適当にネット検索して、どこかの誰かが公開している英文のPDFファイルも見つけました。次にどこをどうクリックすればいいのでしょうか?

お礼日時:2006/03/08 12:16

2年ほど前にOCRソフトを使ってみて、これはダメだとお蔵入りさせました。


エプソンに付いていた「読んでココ」を製品版(Ver.6)にバージョンアップしたものです。
とにかく誤認識が多くて、OCRソフトは使わずに手で打ち込んでいました。
ところが去年の末に大量の文章を変換する必要に迫られ、知人に手伝ってもらうことにしたら、OCRソフトで簡単に出来たと言うので、半信半疑で最新版にバージョンアップしたら、これは使えます。
確かに一部レイアウトは崩れるので修正は必要ですが、ほぼ完璧な読み取り、驚きました。
コツは高解像度で取り込み、色の付いた原稿はソフトの機能で白黒にして、傾きなども修正して認識作業をやること。
英数の活字はほぼ100%、日本語も95%以上はいけると思います。(私のアバウトな感覚で)

http://ai2you.com/ocr/ocr/index.asp

現在Ver.11を使っていますが、色の原稿の読み取りを強化したVer.12が出ましたね。
    • good
    • 0
この回答へのお礼

心強い体験談をありがとうございました。色の読み取りは、ほぼ無用なので、リンクを参考に試してみようと思います。

お礼日時:2006/03/08 11:26

日本語文書ということでお答えします。


安いスキャナにOCRが付いているのは確かですが、いくらの機種に付いているかは残念ながら調べていません。噂では数万円でも付いているそうです。
「かなりの精度」はあまり信用しない方が良いでしょう。90%読めれば良いとおっしゃいますが、90%の認識結果がどんなものかご存知ですか。99%以上ないとまず使えないでしょう。
図などは必要なく文字だけ、とおっしゃいますが、そこが問題なんです。ページ数や柱(ページの上方にある見出し的なものです)は流石に読みませんが、図を読み飛ばすにしても図の説明を本文と読み間違えたりします。用途によりますが、理系の論文で数式が出てきたらメロメロです。表は読んで欲しいかも知れませんがムリでしょう。
結局、読ませる範囲をマウスで指定することになり、その場合OCRによっては98%以上の精度では読むと思いますが、マウス指示が耐えられるかどうかです。
二段組の文書を一段で読むOCRは現在はないとは思いますが、段の中に図表が入っていると、読む順序がめちゃくちゃになるものがあります。

この回答への補足

なるほど、なんとなく分かりました。ありがとうございます。

ただ、説明不足でしたが、こういうことなのです。実は娯楽系の英文和訳を頻繁にしています。その際に、ミスタイプを避けるために、固有名詞や年号を打ち直すことなく原文のまま採用できたり、時間節約のために、分からない単語などをオンライン辞書にコピペできると便利なのです。つまり、そうした必要な単語以外は、PC上では読めなくても、横に置いた紙で読めれば構わないのです。

また、私が扱う文書には、図や表は殆ど登場しませんし、登場するとしても、そこだけを避けて自分で拡大コピーするなり手作業で切り貼りするなりして、「1段の文書だけ」というレイアウトにすることは可能ですよね。

以上のことを想定した場合、OCR付の10万円以下のスキャナを購入する価値はあると思いますか? もちろん、PCに取り込んだ文書のレイアウトがぐしゃぐしゃになって、どこに求めている単語があるか分からないようでは困るのですが。

もしくはスキャナを購入前に試す方法はないでものでしょうか。それができれば、このサイトでお手を煩わせなくても済むのですが。

補足日時:2006/03/07 22:06
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!