新しく質問する

PDFのデータをテキスト化すると文字化けしてしまいます・・

役に立った:5件
  • 質問者:muki1682
  • 投稿日時:2009/01/02 11:24
  • 困り度:すぐに回答が欲しいです
  • 友達に紹介
  • ブログに書く
  • 教えて!gooお気に入り

あけましておめでとうございます。

PDFの中のデータをテキストファイルに移行しようとしてコピペや、テキストとして保存しようとするのですが、すべての文字が、
・・・・・・・・に文字化けしてしまいます。
なぜこうなるのか、まったく私にはわかりません。

どなたかお詳しい方、お助けください。

よろしくお願いいたします。

この質問への回答は締め切られました。
このQ&Aは役に立ちましたか?(役に立った:5件)
  • 参考になった:1件

No.3ベストアンサー10pt

  • 回答者:U-Seven
  • 回答日時:2009/01/03 22:38

うーん、私も無理でした。
これは東洋経済社発行の会社四季報CD-ROMのデータですね。

簡単にコピー出来るようだと出版社としては困りますので、コピーや再配布を防止するために細工がされているようです。
一種の著作権保護と思って下さい。
もしかしたら文字化けではなくて、ダミーで初めから・・・・・・を透明テキストとして付けてあるのかもしれません。

通報する

この回答へのお礼

お察しの通りです。
確かにダミーを入れている可能性がありますね。
OCRで何とか認識しますのでせっせとそこから構築するほかないようです。

東洋経済の了見の狭さには辟易してしまいます。
競争相手が少ない弊害ですね。
テキスト保存する理由は、四季報程度の解析機能じゃ不十分だから自分で解析せざるを得ないからなのに、それを拒むなんて・・という思いはあります。
前よりはめんどくさくなりますがせっせとデータ作成いたします。




ありがとうございました。

  • 参考になった:0件

No.2ベストアンサー20pt

  • 回答者:violet430
  • 回答日時:2009/01/02 20:53

>また、ほかのPDFファイルは普通にコピペできるのですが、これはまったくだめです。

やってみましたが文字データは無い様ですね。1バイトの空白だけがコピーされます。
JustPDF変換もやってみましたが、文字データは変換されませんでした。
やさしくpdfOCRで文字認識をした結果、文字認識はされました。
どうも何か仕掛けがしてあるようですね。
Justpdf編集などのpdf編集ソフトを使ってデータを調べてみないと詳細は分からないと思います。

通報する

この回答へのお礼

ご回答ありがとうございました。
PDFのプロパティを見ても、私には解析する知恵を持ち合わせていませんので、わかりませんでした・・・
残念です。

せっかくの元日のお休みのところ、時間を割いていただき本当にありがとうございました。

  • 参考になった:0件
  • 回答者:violet430
  • 回答日時:2009/01/02 14:39

全ての文字がjis非対応のunicode対応文字で、かつペースとしたソフトがunicodeに対応していない場合はそうなります。
しかし、現実にはそういうケースは珍しいですね。
何か他に原因が有るかもしれないです。
どのpdfファイルでも発生するのか?
そのpdfファイルを他のパソコンでコピーアンドペーストした場合はどうなるのか?
もう少し情報集めをお願いします。

通報する

この回答への補足

ご回答ありがとうございます。


ほかのパソコンでもできないようです。
また、ほかのPDFファイルは普通にコピペできるのですが、これはまったくだめです。

そのファイルをアップロードいたしますので、もしよろしければ見て頂けるとありがたく存じます。(ウイルスチェックはしております)

http://stoc.as.wakwak.ne.jp/cgi-bin/d.cgi?c=SorG …
よろしくお願い申し上げます。

  
このQ&Aは役に立ちましたか?(役に立った:5件)

このページのトップへ

Facebook公式ページ

公式Twitter