アプリ版:「スタンプのみでお礼する」機能のリリースについて

画像データ(BMPやJpegやGif)をテキスト形式で出力して読みたいんです。
出きるんでしょうか?
出きるのであれば、必要なソフトはありますか?

それと、CADデータ(CATIAやI-deas、UG)なんかのCADデータをテキスト形式で読むには、どうしたらいいんでしょうか?

少し、素人では難しくて、どうしたら良いかわからないんです。

どなたか詳しい人、いたら教えてください。

A 回答 (6件)

バイナリを直接読んで、絵が浮かぶ人はいないと思いますので、画像データに表示されている文字を、テキストデータで取り込みたいということだと思います。



上記をふまえて、

OCRというソフトウェアがありますので、探してみてはどうでしょう。

私のところでは、一太郎とセットで販売されていた、「一発OCR」
http://www.justsystem.co.jp/software/dt/ocrpro2/ …
というソフトを使っています。他にも、
「読んde!!ココ」
http://www.vector.co.jp/soft/win95/writing/se277 …
とか、
「読み取り革命」
http://panasonic.co.jp/pss/pstc/products/yomikaku/
とかがあります。
他にもあると思いますので、検索してみてはいかがでしょうか。

もう一つの、CADデータからの読み取りは、少々むつかしいかと思います。

CATIA I-deas UG はどれも3次元CADなので、データを簡単に見る方法すらありません。それぞれのCADを用意するか、そのデータを扱えるビューワ(表示だけ出来るソフト)を用意されるしかないでしょう。
それでも、そこからテキストデータを切り出すことが出来るかどうかは、ビューワの仕様によります。

CADは3次元でも、テキストが書かれているのが2次元データであれば、DXF形式等で出力して頂いて、2次元CADで読み込む。あるいは、DXFそのものがテキストデータなので、エディタ等で開いて、該当部分を切り出す方法が使えるでしょう。

最悪でも、元のCADデータを表示することが出来れば、スクリーンコピーで表示画面をビットマップに保存して、OCRにかけることで読み取ることも出来ますね。
    • good
    • 0

>識字率は50%以下ですから



対象物にもよりますね。
新聞や、フォントの決まった書類、CADでかかれた図面などは、汚れが少なければ90%を切ることはありませんよ。

今のOCRソフトは、誤認識した文字を指定して教えてやれば、同一(近似)パターンはすべて直してくれますので、やるたびに利口になっていきます。

たとえば、毎日同じ新聞の切り抜きを読み込ませると、最初の数回は誤認識の修正が必要ですが、後は、ほとんど手直しが必要ないレベルになります。

いかにきれいなソースをかませてやるかがポイントになるようです。

ただし、手書きの文書や図面では悲惨なことになります。図面はわりと読み込みやすい様です。製図規格がきちっとしている会社の図面ほど識字率はいいですね。
特に数字については、あまり問題になった記憶がありません。(小数点とカンマの誤認識は多いですが、さして問題にはなりませんでした)
数字は書く人の癖が一定しているようです。いっそのこと、おもいっきりくせ字の方のほうが、字体が一定していていいかもしれませんね;P
    • good
    • 0

 画像データをOCRというソフトで認識させることができるのですが、印刷物をスキャナでスキャンした時でも識字率(文字として正確に判別できるかどうかは50%以下ですから、まして画像データ(写真とか)から文字を識字させるのは、ほぼ無理と考えてください。



 やってみれば分かりますが、やるだけムダだったというのがほとんどです(^^;
    • good
    • 0

?リ?・JFIF ・・ ?・?hotoshop 3.0 8BIM・ x H H -7?・・;E鵤{・ XX wp d ' 0 ・ ・ @ 8BIM・ ・ ・ 8BIM


x8BIM・ 8BIM
8BIM'
8BIM・ H /ff lff /ff 。劒 2 Z 5 - 8BIM・ p ??????????????????????・ ??????????????????????・ ??????????????????????・ ??????????????????????・ 8BIM @ @ 8BIM 8BIM ゜ p T P n@ テ ?リ?・JFIF H H ? &File written by Adobe Photoshopィ 5.1?・Adobe d? ?ロ ・



?タ T p" ?ン ?ト?

3 !1AQa"q・贈アB#$Rチb34rびC%担鞜?s5「イ・D典dEツ」t6メU稙魍・モu胚F'筈・米ヤ蔬・オナユ襄Vfv・ヲカニヨ踐7GWgw∠ァキヌラ銷 5 !1AQaq"2¢。アB#チRム・$b疵rCScs4・「イ・&5ツメD典」dEU6te糘ウ・モu胚F筈・米ヤ蔬・オナユ襄Vfv・ヲカニヨ踐'7GWgw∠ァキヌ?レ ? ・テエo?・_ト6ニオニ・ゥ・・Kヘ・Pオウ Aレ・9・ュ|リOオ? 喙????? ワ・Qナ雰霰7陌レuuイ諧f゜ムツ"頡H朎Mud(1)&KG?ロカマボ勸.・ケ鋧ヲロA・毆サw・~日・・ヨXタヌ龜$KZ89フロ﨏ケ? ???節???俍26華ンミニ﨎?・? G・・bユクテ=6・ン・゛詬ウfマ馞f臭5マ項ラヒ・沾ラ C゜ソ?6ヌ}& メ!サ・沆ヘ蕫ハ?勀廚cwZラ・ヒy・>髞樒キンソ$ヨ? ネ・アョ0ツ?H;H琢ルケッル? ? I・k釈|クシ?vマホu{ソッ・? =傔ンサ峡ミチsセ馬ン・・ 擱カ・k$サYヨ}ア?}/?J」Tホ?シ>u際ァkc?弡[・ ム{Lャ寄1・ツv・ッ

 これが画像データの中身ですが(最初からの数行です)
慣れれば、これを見て中身がどんな画像か分かるとは思いますが、一般的には無理でしょうね。プロでも無理でしょう(^^;
    • good
    • 0

#2さんの説明で、質問の意味が理解できました。


私はよく質問の意味をはき違えて発言してしまうことが
多々あり、迷惑をかけてしまいます^^;
申し訳ありませんでした。
    • good
    • 0

画像はバイナリファイルなので、


テキストエディタでは文字化けして読めません。
バイナリエディタですと、16進数で表示された
数字の列は見れると思います。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!