画像をPDFにしたものを日本語OCR認識するソフトはありますか。探せなかったので情報をお待ちします。

このQ&Aに関連する最新のQ&A

A 回答 (4件)

こんにちは、


AIソフト社から発売されています。読んde!!ココVer7
がAdobe Acrobatの画面上にアイコンが追加されていてPDFを読み込めるようです。(わたしは使った事は有りませんが・・・)

ただしPDFを直接OCR処理するには、Adobe Acrobat 4.0、5.0が必要とのことです。(Readerじゃダメ)
詳しくは下記URLを参照ください。
以上参考まで!

参考URL:http://www.aisoft.co.jp/ocr/
    • good
    • 0
この回答へのお礼

回答ありがとうございました。これで、私の目的は達することができそうです。高価なソフトだけは知っていたのですが、これで楽に導入できます。\(=^o^=)/

お礼日時:2001/05/17 07:10

以前同様の質問をしました。


以下の参考URLサイトには関連質問の回答がありますが、参考になりますでしょうか?

ご参考まで。

参考URL:http://www.okweb.ne.jp/kotaeru.php3?q=29548
    • good
    • 0

残念ながら、PDFの画像ファイルに特化したOCRはないと思います。


ACROBATから「ファイル→印刷」したものをスキャンしてOCRにかけるしか手はないと思います。
    • good
    • 0

PDFファイルのページビューは、すべてを選択(Ctrl+A)→コピー(Ctrl+C)で内容をコピーすることができるので、OCRを使わなくてもテキストに書き出すことができると思うのですが…。


もし何らかのプロテクトがかかってコピーできない場合は、Alt+PrintScreenで画面イメージを複写、ペイントなどでビットマップに変換すればいいのでは?
2値ビットマップ画像なら、読んDe!!ココなどほとんどのOCRソフトで取り扱えると思います。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Q株価情報をOCR(光学文字認識)で取得

証券会社のトレードツールは株価情報をリアルタイムに閲覧することができます。
この株価情報をOCRで取得しファイルに出力したいのですが、そのようなことを可能にするソフトはご存知でしょうか?
楽天RSSというサービスを使用すればexcelに株価情報を出力しリアルタイムで閲覧することができるのですが、OCR(光学文字認識)で株の気配値を取得しファイルに出力したいのです。
もしソフトが無い場合は自分で作れるように勉強したいのですが、必要な言語・参考になる情報源〈本やURL〉をご教示頂けると幸いです。
宜しくお願い致します。

Aベストアンサー

Excelを含むOfficeなんかでも可能です。

Microsoft Office 2010 で使用する MODI のインストール
http://support.microsoft.com/kb/982760/ja

でMODIをインストールして、ExcelのVBAだと、

dim modiDocument

modiDocument=CreateOLEObj("MODI.Document")
modiDocument.Create(画像ファイル)
modiDocument.OCR(17,false,false)
ocrtext = modiDocument.Images[0].Layout.Text

だとか。


> この株価情報をOCRで取得しファイルに出力したいのですが、

ただし、OCR処理をする以上、画面に表示されるフォントでも、認識率は100%ではありません。
銘柄なんかならともかく、株価の価格なんかを読み取り損ね、誤認識するとえらい事になりかねません。

Q日本語の認識率が高いOCR

活字文字データですが画像として認識されているPDFファイルがあります。このPDFを元に文字データとしてWordやExcelで使いたいためOCRを探しています。
データは例えば住所氏名電話番号などのように日本語(漢字カタカナひらがな)と英数字です。
出来るだけ高い認識率がいいです。できればフリー、有償でも2,3万以内でないでしょうか。有償の場合試用期間があり試せるものが良いです。
パソコンはWindows7です。

よろしくお願いします。

Aベストアンサー

OCRソフトは体験版で試すしかないですが、設定で認識率が向上します。
私は「読んでココ」と「本格読取」を使っており、前者は取り込んだ後画像の補正でゴミ取りをやり、日本語英語混在などを指定するとけっこういけます。
後者も安いですが実用レベルにはあると思います。

http://ai2you.com/ocr/product/koko13/koko13.asp

http://www.sourcenext.com/titles/use/124260/
体験版はないので、開発元のものを当たってください。

http://panasonic.co.jp/sn/psn/pstc/products/yomikaku/

当然ながらご認識はあるので、それを修正して辞書を鍛えていくとだんだん認識率が上がります。

Q画像認識(OCR)ソフトでこんなことは出来ますか?

お世話になります。
OCRソフト(有料でもOK)で、文字を認識出来るのはありますが、次のようなことはできますか?

折れ線グラフが、書いてある(X,Y、には、数字単位が記入したある) 画像データ(JPG)があります。

これを、OCRで、数字と、グラフの線を認識させて
エクセルに、折れ線グラフを再現させることは出来るのでしょうか?

自分的には、無理度98%というところです。
そのようなことが現在市販されているソフトで、可能
かどうか、教えて下さい

Aベストアンサー

こんにちは。
グラフの「スキャン→数値化」を行ってくれるソフトは、
高機能なものから、フリーソフトまで各種あるようですよ。
3つめの「Graphcel」は、フリーソフト(Pro=有料も有り。)の方を使用したことがあります。
目的にもよるでしょうが、私の場合(分光反射チャートの数値化)結構使えましたよ。

「 UnGraph 5 」
http://www.hulinks.co.jp/software/ungraph/index.html

「 ImageToGraph32 」
http://www.vector.co.jp/soft/win95/business/se075945.html

「 Graphcel 」
http://t_kobo.at.infoseek.co.jp/

QAcrobat6.0を使ってOCRしてテキスト検索可能なPDFファイルを作る方法

Acrobat6.0を使ってOCRしてテキスト検索可能なPDFファイルを作る方法を教えて下さい

Aベストアンサー

1.OCRするとはスキャナーで原稿を読み取るということでしょうか。

その手順で、PDFファイルを作成すると、
ハード;ACROBAT6インストール済みのPCにスキャナーを接続し正常に動作する状態。

Acrobat6の操作;ツールバーのpdfの作成-スキャナー で接続済みのスキャナーを確認してスキャンすれば、pdfファイルが完成。

但し、スキャナーで取り込んだデータをpdf化したファイルは、画像ファイルですから、画像に書かれているテキスト文字の検索はできません。

2.通常テキスト選択可能なpdfファイルを作成するには、ワードやエクセル等の文字データファイルをacrobatを使用してpdf化します。具体的手順は以下3.です。

3.画像データの文字を検索可能なPDFファイルに変換するには、画像→文字変換ソフト(よんでココ、読み取り革命 等のソフト)で画像を文字に変換後データファイルに保存してから、そのファイルをacrobat6でPDFファイルに変換する

何か参考になれば幸いです。

Qフリーソフトにocrソフトのおすすめはナイデショウカ? 

松下電器産業の「読取革命Ver.7」(希望小売価格1万9800円)
このソフトのカタログを見ていましたが手が出ないのでフリーソフトでいいのがあれば紹介して下さい
やりたいことはデジカメで文章を撮りスキャナで読みパソコンでテキストデータベースを作成したいのですが?

Aベストアンサー

http://www.okweb.ne.jp/kotaeru.php3?
qid==512541
に懐古経験談を記しましたが、個人で作るのは相当難しいようです。特に人により文字にクセのある手書き文字読み取りが難物です。またスキャナで読んで得たイメージデータから、文字コードを割り出すロジック(理論)が
何々法と言う風にアイデアが色々あるようで(良いものは特許がとられているかも知れない)、良い理論を開発することが難しいようです。勿論高度なプログラム作製力も必要です。そういう研究や勉強の裏打ち経験が要るようです。
特に認識率を上げるには相当色々工夫を組み合わせて(有名なのは用語・用例辞書などを索引して参考にする)が要るようです。それでフリーソフトが少ないと思います。
直接の回答でないので残念ですが、フリーソフトが少ないことと、あっても文字表現の制限がきついとか、文字認識率がもうひとつというのは覚悟すべきでしょう。


人気Q&Aランキング

おすすめ情報