プロが教えるわが家の防犯対策術!

画像になっている文書の文字をテキストデータにする、2~3千円の安いソフトはないでしょうか。
今すぐ必要なのでダウンロードできるものがよいです。

PDFの文字をテキスト化したいのですが、コピーペーストしすると意味不明の記号になります。制限は何もかかってないし、文字列の選択もできます。

で、画像としてキャプチャして、テキストにできないかと思うのですが・・・Webで探して、高価なOCRソフトが見つかったのですが、の今回だけのために買うのはもったいないし・・・「読んdeココ」は、体験版だとクリップボードからのOCR機能がないので、だめでした。

よろしくお願いします。

A 回答 (4件)

>スキャナで読み取るのではなく、PC上で画像として保存すればよいのですよね




そうです。
PC上で画像での処理で大丈夫です。
デジカメ、TWAIN、画像からの読み込みが可能です。
    • good
    • 0
この回答へのお礼

どうもありがとうございました。
安いので買ってみました。「e」が全部「c」になったりして文字化けは多いですが、ゼロから手入力するよりはずっと楽なので、モトは取れた感じです。

お礼日時:2004/05/26 14:40

>画像としてキャプチャして、テキストにできないかと思うのですが・・・



PDFデータをキャプチャーして、JPG等のデータにしてからなら
ソースネクストの「本格読取(R)」で可能かと思います。
直接PDFデータを読み込む事は出来ないので、一度Acrobat Reader で読み出してから
キャプチャーして別形式データで保存後に「本格読取(R)」で編集って流れです。

私は使用してますが、かなり便利です。
スキャナーで読み取った雑誌をワード形式で編集出来たりします。
「本格読取(R)」の仕様は参考URLにて確認してみて下さい。(値段は2,079円で即DL可能です)

参考URL:http://www.sourcenext.com/products/honkaku_y/

この回答への補足

ありがとうございます!よさそうですね。
スキャナで読み取るのではなく、PC上で画像として保存すればよいのですよね(スキャナを持ってないので)。
Webサイトの説明では確信が持てなかったのですが・・・

補足日時:2004/05/20 08:40
    • good
    • 0

下記ページに、



『…和文フォントを含むPDFファイルを作成する場合、Acrobat3互換形式を選択してPDFファイルを作成すると、和文フォントはエンコーディング=ビルトインでPDFファイル中に埋め込まれてしまいます。この形式で作成されたPDFファイルはAcrobat3、Acrobat4で正常に表示・印刷されるように見えますが、Acrobat3 環境では以下の不具合が見られます。
1.テキストの再利用が不可(コピー&ペーストで他アプリで文字化け)
2.テキスト検索不可 』

との旨、記述があります。

(元ページが見つからないのでGoogleのキャッシュです)
http://www.google.co.jp/search?q=cache:1berJqDZN …

PDF書類の閲覧には、どのようなソフトをお使いでしょうか。もしAcrobat Reader 3.0xなど古いバージョンのソフトをお使いでしたら、新しいバージョンのものをインストールすると、もしかしたらコピー&ペーストの際の文字化けが解消するかもしれません。
http://www.adobe.co.jp/products/acrobat/readstep …

参考URL:http://www.adobe.co.jp/products/acrobat/readstep …

この回答への補足

詳しくありがとうございます。
Acrobat5.0で開いています。また、中身は英文だけなので、和文フォントの問題ではなさそうです。説明不足ですいませんでした。(でも今後の参考になります。)
作成時のソフトのバージョンは不明です。
単にファイルが壊れているのかも・・・

補足日時:2004/05/19 20:47
    • good
    • 0

> PDFの文字をテキスト化したいのですが、コピーペーストしすると意味不明の記号になります。



PDFの中の文字はちゃんとテキストなんですよね。だったらコピペでうまくいくと思うんですが。
何のソフトにペーストしていますか?そのソフトのフォント設定によっては化けてしまうことがあります。
例えば、『あ』と入力して日本語になることを確認した後、その『あ』を選択してペーストしてみて下さい。
それでもだめでしょうか?

この回答への補足

ありがとうございます。
テキストエディタDanaやMS Wordにコピーしたのですが、だめです。Acrobatで、txtやrtfで保存しても同じ結果です。(たまに、こういうPDFに出会います。。。)
PDF内で文字列検索できないので、そもそも文字として認識されないようです。

補足日時:2004/05/19 19:23
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!