アプリ版:「スタンプのみでお礼する」機能のリリースについて

英字新聞をスキャナーで読み込んで翻訳ソフトを使って日本語にするには?

A 回答 (2件)

一応、新しい有名なOCR なら、スキャナーでテキストは取ることは可能です。



今どきのOCR には、ハイフネーションの削除や、段落分けの機能ぐらいはあるはずです。(例えば、読んde!ココ、読取革命、E.Typist) 目で見た通りの一行改行か、段落改行かは、選択することが可能で、右端のスペースの関係で、段落改行は正確にはできないこともありますが、ほぼ、問題ありません。ハイフネーションは、削除しないほうがよいことも多いはずです。本来、two words だったものをハイフンでつなげただけのものは、ハイフンを削除したら、何の単語か、翻訳ソフトでは検知できなくなります。

しかし、特殊フォントの切り分け、例えば、fi などは、フォントがくっついて、i の点がないものがありますので、それがOCRによって、誤認識するものがあります。有名なOCR は必ず試用版が出ていますから、それは試してみればよいです。試用版が出ていない会社のものは使わないほうがよいです。

ただし、OCR は、スキャナーと相性がありますから、スキャナー指定のOCRを使うべきです。OCR 自体にも使いこなしがありますが、試用版では、ほとんど慣れるまでには至りません。スキャナーそのままで、OCRに流しこんでも、News Paper の色は、純粋には背景が白ではありませんから、誤認識する場合は、調整が必要になります。だいたい、98%の認識率以上はないと、上手く撮れているとは言えません。上手く撮れていないのは、OCR, スキャナーの使いこなしの問題だと思ってよいです。また、メーカーのサポートは、私の経験ではほとんど期待できませんでした。私は、8年ぐらい前から、二つのメーカーのOCRを使いこなしていました。理由は、日本文の得意なソフトと英文が得意なソフトの二種類がありました。今では、メーカーごとの差は少なくなりました。

テキスト化するよりも翻訳ソフト側の性能の問題です。だいたい、英検2級以上のレベルでないと、翻訳ソフトを使っても、英文は正しい日本語にはならない可能性が強いです。後は、英語カテゴリでお聞きなったほうが、詳しい説明がつくと思います。
    • good
    • 0
この回答へのお礼

どうもありがとうございます。いろいろな翻訳の仕方はあるかななんて思っているんですけど?年を取ると自分なりに整理がつかなくて、アドバイスをいただいて翻訳の仕方順序がうっすらと見えてきました。いろいろ試して見たいと思います。 Im not two hundred years old. 「私は200歳ではない」 ソフトでは? 生きた英語は自分はまだ若いこんなことかと思います。どうもありがとうございます。そちらさんもがんばってください。

お礼日時:2010/05/22 23:43

日本語にする前が問題



新聞をスキャナーで読み込んでテキスト化するのは難しい
一番の問題は新聞の段組(テキストのレイアウト)とハイフネーション
勝手なところで行末にハイフンが入り、次の行に続く(手作業でハイフンを削除する必要あり)
段組があるから、その段にあうようスキャナーの矩形範囲を指定し直さないとならない(段組のまま読み込まれるので、文末の改行を削除する必要あり)

やってみればわかるけど、手間がかかるよ~
    • good
    • 0
この回答へのお礼

ありがとうございました。手作業でわ手間がかかり大変なんだということが手をとるようにわかりました。新聞を見ながら翻訳ソフトに手作業で入力するほうが、急がば回れですね。適切な回答どうもありがとうございます。あなた様もお元気でがんばってください。

お礼日時:2010/05/22 15:21

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!