電子書籍の厳選無料作品が豊富!

いつもアドバイスありがとうございます。
タイトルのとおり、大量の英文書類をテキストファイル化したいのですが、どのようなスキャナを選べばよいでしょうか。

メーカーのサイトでカタログなどを見ても、写真が綺麗に取り込めるとか、書類をPDFファイル化できるといった説明があるだけで、英文書類→テキストファイルにどういった機種が適しているかという点については説明が見あたりません。

できるだけ読み取りミスや誤変換が少なくて、なおかつあまり高価でないと助かります。メーカー名、機種、選ぶポイントなど、なんでも良いのでお願いします。うちで使っているのはぜんぜんだめ、という情報でもかまいません(その際は機種やスペック(?)などを教えてください)。

できれば今日買いに行きたいと思っているので、すみませんが至急よろしくお願いします。

A 回答 (5件)

OCRの用途なら、市販のどのスキャナでも性能的に問題はありません。

ただし、OCRソフトは別に買い求めることをお薦めします。

大量の文書を画像化するなら、ADFは必須です。文書専用のスキャナがお薦めです。
http://scansnap.fujitsu.com/jp/feature/
http://cweb.canon.jp/documentscanner/dr-2050c/in …

本のようなものも含むならフラットベッド型になります。
http://cweb.canon.jp/documentscanner/dr-1210c/in …
複合機でADF付きでもいいと思います(HPやブラザーなどはインクの入手製に難がありますが…)。
http://cweb.canon.jp/pixus/lineup/mp830/index.html
http://h50146.www5.hp.com/products/printers/bizi …
http://www.brother.co.jp/product/mymio/info/mfc4 …

>できるだけ読み取りミスや誤変換が少なくて、…
これはOCRソフトの性能によります。一般的な製品しか使ったことはありませんが、細かい文字、図表が多い場合の変換精度は、相当落ちます。
使ってみれば分かりますが、「lと1」「Oと0」などに限らず誤変換は多いです。はっきり言って自分で打った方が早いのでは?と思うこともしばしばです。

以下のようなソフトはメジャーで試用も可能ですから、自分で試すのが一番です。
http://ai2you.com/ocr/
http://pac.mediadrive.jp/products/
http://panasonic.co.jp/pss/pstc/products/yomikak …

↓なども参考になると思います。
http://arena.nikkeibp.co.jp/tokushu/biz/20050322 …

この回答への補足

★★英文を変換させるなら、日本製のOCRよりもアメリカ製などのOCRソフトの方がよいのでしょうか?★★

補足日時:2007/02/11 13:32
    • good
    • 0
この回答へのお礼

ありがとうございます。
自動紙送りがついているとたしかに便利ですが、かなり値段が張るようなのであきらめるつもりでした。原稿を差す時間よりも、誤変換などを見つけて直す時間と手間が惜しいので、そちらを重視するつもりです。

OCRソフトのサイトの紹介、助かります。
スキャナは安いものを購入して、いろいろなソフトを試してみようと思います。

お礼日時:2007/02/11 13:25

一時期ひたすらOCRしてました。

日本語も英語もやりました。
英文の場合、英文専用OCRソフトを使うことがとても重要です。私はe.Typist internationalに付属のTextBridgeなどを使ってました。
英文の活字は隣り合う文字がくっつくので、和文OCRソフトでは正しく認識されないことが多かったです。
rnをmと認識したり、 fiが活字ではiの点がfにくっついているため、nと認識されたりします。また、Iをエに変換されたりするのも苦痛ですしね。
あと、英文スペルチェッカー機能は必須です。機械がスペルがおかしいと指摘された文字だけチェックするだけでほとんどの誤字は直ります。人間が全文を目でチェックすると、全文入力し直した方が楽じゃないかと思うほどたいへんです。特に英文はスペルチェック機能が優れてますから、必須といっていい機能でしょう。

スキャナーは、ふつうの文字サイズだと、白黒400dpiで読みとることが非常に重要で、300dpiだとエラーが多発し、600dpiだとソフトがA4に対応しなくなりました。もっとも、今ならどのスキャナーもこれはクリアしてます。原稿が新聞紙だと、紙のざらざらが点になって写り込むせいか認識率は落ちました(1行に5カ所くらい誤字がある程度)。つるっとした紙に印刷された文字だと認識率は高かったです(2~3行に1文字の誤字がある程度)。

蛇足です。
1年ぐらいひたすらOCRやった後、結局OCRはかけずにキーワードだけ手入力してグラフィックのまま保存するのが最も便利で時間節約になると判断して、OCRしなくなりました。レイアウトも読みやすさの重要な要因で、ベタのテキストだけだと読みにくいです。またどこの文字が誤字か考えながら読みなおすのも苦痛でした。一番良いのは頭に入れてしまうことなんですが。OCRする作業時間中は文字ばかり見ているので文章としては頭に入ってきませんでした。後日読み直すなら、OCRしないでそのときにしっかり文章を読んで頭に入れるのがお得です。

この回答への補足

みなさま、お世話になりました。
エプソンの一番安い機種を購入しました。
まだいまいち使い方がわかっていないのと、WindowsMeでは読み込みに途方もない時間がかかってしまうのですが、来週には新しいパソコンが届くので(Vistaです!!)それまでに使い方を勉強したいと思います。

補足日時:2007/02/12 22:10
    • good
    • 0
この回答へのお礼

ありがとうございます。
やはり英文専用のOCRがあるのですね。こちらで質問してみてよかったです。
蛇足の件は、テキストファイル化した英文をさらに加工しなければならないので、グラフィックのままでは役に立たないのです。しかし親切に教えていただきありがとうございます。

今日お店に行ってCANONとエプソンのカタログをもらってきました。
みなさんのご意見を参考に、もう一晩考えてから買いにいきます。

お礼日時:2007/02/11 20:08

時々スキャナ→OCR変換をしていますが・・・(日本語ですが)


原本にもよりますがOCRの認識率はよくありません、場合によっては再入力した方が速い場合があります。
(業者の使用するソフトは知りません)
従ってあまり大量の書類をテキスト変換するのであれば、#1 さんも書いていらっしゃいますが、業者に出した方が確実で早いと思います。
Googleなどで「英文 入力代行」などと検索すればヒットします。
    • good
    • 0
この回答へのお礼

ありがとうございます。
業者に出すことは考えていません。
日本語の場合、認識率はよくないとのことですが、英文の方が日本語ほど文字が複雑でないので、日本語よりもよく認識されるのではないかと思いました。

お礼日時:2007/02/11 13:31

えっと、スキャナは書籍→画像ファイルのみを行います。


画像ファイル→テキストファイルはOCRソフト(大抵のスキャナ付属)を用いて行っています。
スキャナを良くすると画像ファイルの画質が良くなり、OCRで読む際に精度が上がったりするのですが
むしろOCRのソフトの質の方が問題だと思います。
付属のOCRソフトはどれも質が良くないので。

>>英文書類→テキストファイルにどういった機種が適しているかという点については説明が見あたりません。
ここはスキャナの説明ではなく付属のOCRの説明に当たるので、説明があまりないのだと思います。

自分はOCRを読んde!!ココ Ver.10 ファイリングOCRを使用していますが、個人使用では特に問題ないです。
    • good
    • 0
この回答へのお礼

ありがとうございます。
スキャナ自体は安いものを購入し、使い勝手をみたうえで、OCRソフトの良いものを買い求めようと思います。

お礼日時:2007/02/11 13:20

予算、枚数が分からないのですが、場合によっては、業者へ頼んだ方がいい場合もあります。


A4一枚あたりの作業時間をどのくらいと想像していますか?
    • good
    • 0
この回答へのお礼

補足要求ありがとうございます。
業者に出すことは考えていません。スキャナ購入を前提に質問させていただいています。

お礼日時:2007/02/11 13:16

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!