
いつもアドバイスありがとうございます。
タイトルのとおり、大量の英文書類をテキストファイル化したいのですが、どのようなスキャナを選べばよいでしょうか。
メーカーのサイトでカタログなどを見ても、写真が綺麗に取り込めるとか、書類をPDFファイル化できるといった説明があるだけで、英文書類→テキストファイルにどういった機種が適しているかという点については説明が見あたりません。
できるだけ読み取りミスや誤変換が少なくて、なおかつあまり高価でないと助かります。メーカー名、機種、選ぶポイントなど、なんでも良いのでお願いします。うちで使っているのはぜんぜんだめ、という情報でもかまいません(その際は機種やスペック(?)などを教えてください)。
できれば今日買いに行きたいと思っているので、すみませんが至急よろしくお願いします。
No.3ベストアンサー
- 回答日時:
OCRの用途なら、市販のどのスキャナでも性能的に問題はありません。
ただし、OCRソフトは別に買い求めることをお薦めします。大量の文書を画像化するなら、ADFは必須です。文書専用のスキャナがお薦めです。
http://scansnap.fujitsu.com/jp/feature/
http://cweb.canon.jp/documentscanner/dr-2050c/in …
本のようなものも含むならフラットベッド型になります。
http://cweb.canon.jp/documentscanner/dr-1210c/in …
複合機でADF付きでもいいと思います(HPやブラザーなどはインクの入手製に難がありますが…)。
http://cweb.canon.jp/pixus/lineup/mp830/index.html
http://h50146.www5.hp.com/products/printers/bizi …
http://www.brother.co.jp/product/mymio/info/mfc4 …
>できるだけ読み取りミスや誤変換が少なくて、…
これはOCRソフトの性能によります。一般的な製品しか使ったことはありませんが、細かい文字、図表が多い場合の変換精度は、相当落ちます。
使ってみれば分かりますが、「lと1」「Oと0」などに限らず誤変換は多いです。はっきり言って自分で打った方が早いのでは?と思うこともしばしばです。
以下のようなソフトはメジャーで試用も可能ですから、自分で試すのが一番です。
http://ai2you.com/ocr/
http://pac.mediadrive.jp/products/
http://panasonic.co.jp/pss/pstc/products/yomikak …
↓なども参考になると思います。
http://arena.nikkeibp.co.jp/tokushu/biz/20050322 …
ありがとうございます。
自動紙送りがついているとたしかに便利ですが、かなり値段が張るようなのであきらめるつもりでした。原稿を差す時間よりも、誤変換などを見つけて直す時間と手間が惜しいので、そちらを重視するつもりです。
OCRソフトのサイトの紹介、助かります。
スキャナは安いものを購入して、いろいろなソフトを試してみようと思います。
No.5
- 回答日時:
一時期ひたすらOCRしてました。
日本語も英語もやりました。英文の場合、英文専用OCRソフトを使うことがとても重要です。私はe.Typist internationalに付属のTextBridgeなどを使ってました。
英文の活字は隣り合う文字がくっつくので、和文OCRソフトでは正しく認識されないことが多かったです。
rnをmと認識したり、 fiが活字ではiの点がfにくっついているため、nと認識されたりします。また、Iをエに変換されたりするのも苦痛ですしね。
あと、英文スペルチェッカー機能は必須です。機械がスペルがおかしいと指摘された文字だけチェックするだけでほとんどの誤字は直ります。人間が全文を目でチェックすると、全文入力し直した方が楽じゃないかと思うほどたいへんです。特に英文はスペルチェック機能が優れてますから、必須といっていい機能でしょう。
スキャナーは、ふつうの文字サイズだと、白黒400dpiで読みとることが非常に重要で、300dpiだとエラーが多発し、600dpiだとソフトがA4に対応しなくなりました。もっとも、今ならどのスキャナーもこれはクリアしてます。原稿が新聞紙だと、紙のざらざらが点になって写り込むせいか認識率は落ちました(1行に5カ所くらい誤字がある程度)。つるっとした紙に印刷された文字だと認識率は高かったです(2~3行に1文字の誤字がある程度)。
蛇足です。
1年ぐらいひたすらOCRやった後、結局OCRはかけずにキーワードだけ手入力してグラフィックのまま保存するのが最も便利で時間節約になると判断して、OCRしなくなりました。レイアウトも読みやすさの重要な要因で、ベタのテキストだけだと読みにくいです。またどこの文字が誤字か考えながら読みなおすのも苦痛でした。一番良いのは頭に入れてしまうことなんですが。OCRする作業時間中は文字ばかり見ているので文章としては頭に入ってきませんでした。後日読み直すなら、OCRしないでそのときにしっかり文章を読んで頭に入れるのがお得です。
この回答への補足
みなさま、お世話になりました。
エプソンの一番安い機種を購入しました。
まだいまいち使い方がわかっていないのと、WindowsMeでは読み込みに途方もない時間がかかってしまうのですが、来週には新しいパソコンが届くので(Vistaです!!)それまでに使い方を勉強したいと思います。
ありがとうございます。
やはり英文専用のOCRがあるのですね。こちらで質問してみてよかったです。
蛇足の件は、テキストファイル化した英文をさらに加工しなければならないので、グラフィックのままでは役に立たないのです。しかし親切に教えていただきありがとうございます。
今日お店に行ってCANONとエプソンのカタログをもらってきました。
みなさんのご意見を参考に、もう一晩考えてから買いにいきます。
No.4
- 回答日時:
時々スキャナ→OCR変換をしていますが・・・(日本語ですが)
原本にもよりますがOCRの認識率はよくありません、場合によっては再入力した方が速い場合があります。
(業者の使用するソフトは知りません)
従ってあまり大量の書類をテキスト変換するのであれば、#1 さんも書いていらっしゃいますが、業者に出した方が確実で早いと思います。
Googleなどで「英文 入力代行」などと検索すればヒットします。
ありがとうございます。
業者に出すことは考えていません。
日本語の場合、認識率はよくないとのことですが、英文の方が日本語ほど文字が複雑でないので、日本語よりもよく認識されるのではないかと思いました。
No.2
- 回答日時:
えっと、スキャナは書籍→画像ファイルのみを行います。
画像ファイル→テキストファイルはOCRソフト(大抵のスキャナ付属)を用いて行っています。
スキャナを良くすると画像ファイルの画質が良くなり、OCRで読む際に精度が上がったりするのですが
むしろOCRのソフトの質の方が問題だと思います。
付属のOCRソフトはどれも質が良くないので。
>>英文書類→テキストファイルにどういった機種が適しているかという点については説明が見あたりません。
ここはスキャナの説明ではなく付属のOCRの説明に当たるので、説明があまりないのだと思います。
自分はOCRを読んde!!ココ Ver.10 ファイリングOCRを使用していますが、個人使用では特に問題ないです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 英語 会社で英語を使うことになっての英語の勉強方法 5 2022/07/03 11:49
- 高校 最近考えついた勉強方法についてご意見をいただきたいです。 私は文系の高校生で、将来英語を使った職に就 1 2023/02/04 21:28
- PDF Adobe Acrobat 9 Standard 1 2022/10/16 21:08
- Visual Basic(VBA) エクセルのマクロについて教えてください。 1 2023/08/08 11:02
- 大学受験 娘の大学受験勉強 6 2022/06/30 19:58
- Visual Basic(VBA) エクセルのマクロについて教えてください。 2 2023/07/21 09:42
- その他(生活家電) ミュート機能のあるインターホンでも、外で訪問者が呼び出しベルを押したらピンポンという音は鳴りますか? 3 2023/07/18 10:41
- PDF PDFに精通した方に質問。JPEGファイル群を一つのPDFファイルにするときの容量変化について 6 2023/07/23 19:06
- PHP PHPでテキストファイルに保存した時の改行問題 1 2022/11/19 15:07
- Visual Basic(VBA) エクセルのマクロについて教えてください。 4 2023/07/15 16:33
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
OCRソフトを使って原稿用紙...
-
エクセルVBAで画像から文字を抽...
-
普通のスキャナでネガフィルム...
-
印刷物(活字)のデジタル(テ...
-
MP600のスキャンができない
-
Canonスキャナが使えないので困...
-
スキャナーで読取ったフォーム...
-
スキャナで取り込んだ文章をワ...
-
画像やスクショしたものをスキ...
-
既存の用紙に文字を入力し、印...
-
コピーと原本の見分け方
-
プリンターでスキャンした書類...
-
アウトルックエクスプレスで添...
-
PDF文書だけ印刷すると文字が二...
-
アイホーンの画面の画像を普通...
-
アドレス記号の読み方を教えて!!
-
abmファイルを開くまたは変換す...
-
一部分に貼った紙の周囲に黒い...
-
FAX機買替を機に、どの機能をマ...
-
拡大縮小コピー機を探したい
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
エクセルVBAで画像から文字を抽...
-
OCRソフトを使って原稿用紙...
-
スキャナーで読取ったフォーム...
-
普通のスキャナでネガフィルム...
-
Canonのスキャナ使用際に困って...
-
本の背表紙の文字も正しく認識...
-
英文書類→テキストファイルに適...
-
スキャンできません CanoScan ...
-
スキャナーで取り込んだ画像に...
-
スキャナで画像を取り込んだと...
-
OCR
-
手書き文字・図形をPDF化
-
A4プリントをパソコンに取り込...
-
Canonスキャナが使えないので困...
-
自分で書いた絵をカラー印刷したい
-
楽譜をスキャンしてXMLファイル...
-
自宅でPhotoCDを作りたい
-
綺麗にならない!スキャナで取...
-
スキャナの共有について教えて...
-
スキャナーで色が変になります
おすすめ情報