No.3
- 回答日時:
うーん、私も無理でした。
これは東洋経済社発行の会社四季報CD-ROMのデータですね。
簡単にコピー出来るようだと出版社としては困りますので、コピーや再配布を防止するために細工がされているようです。
一種の著作権保護と思って下さい。
もしかしたら文字化けではなくて、ダミーで初めから・・・・・・を透明テキストとして付けてあるのかもしれません。
お察しの通りです。
確かにダミーを入れている可能性がありますね。
OCRで何とか認識しますのでせっせとそこから構築するほかないようです。
東洋経済の了見の狭さには辟易してしまいます。
競争相手が少ない弊害ですね。
テキスト保存する理由は、四季報程度の解析機能じゃ不十分だから自分で解析せざるを得ないからなのに、それを拒むなんて・・という思いはあります。
前よりはめんどくさくなりますがせっせとデータ作成いたします。
ありがとうございました。
No.2ベストアンサー
- 回答日時:
>また、ほかのPDFファイルは普通にコピペできるのですが、これはまったくだめです。
やってみましたが文字データは無い様ですね。1バイトの空白だけがコピーされます。
JustPDF変換もやってみましたが、文字データは変換されませんでした。
やさしくpdfOCRで文字認識をした結果、文字認識はされました。
どうも何か仕掛けがしてあるようですね。
Justpdf編集などのpdf編集ソフトを使ってデータを調べてみないと詳細は分からないと思います。
ご回答ありがとうございました。
PDFのプロパティを見ても、私には解析する知恵を持ち合わせていませんので、わかりませんでした・・・
残念です。
せっかくの元日のお休みのところ、時間を割いていただき本当にありがとうございました。
No.1
- 回答日時:
全ての文字がjis非対応のunicode対応文字で、かつペースとしたソフトがunicodeに対応していない場合はそうなります。
しかし、現実にはそういうケースは珍しいですね。
何か他に原因が有るかもしれないです。
どのpdfファイルでも発生するのか?
そのpdfファイルを他のパソコンでコピーアンドペーストした場合はどうなるのか?
もう少し情報集めをお願いします。
この回答への補足
ご回答ありがとうございます。
ほかのパソコンでもできないようです。
また、ほかのPDFファイルは普通にコピペできるのですが、これはまったくだめです。
そのファイルをアップロードいたしますので、もしよろしければ見て頂けるとありがたく存じます。(ウイルスチェックはしております)
http://stoc.as.wakwak.ne.jp/cgi-bin/d.cgi?c=SorG …
よろしくお願い申し上げます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Evernote Evernote(エバーノート)の文字化け 1 2022/04/05 19:30
- Excel(エクセル) 文字化け。メモ帳でUTF-8に変換後、エクセルへ貼り付けたいです。 3 2022/08/14 07:21
- PDF Windows10 Chromeで PDF が文字化けします。 4 2022/06/16 06:04
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- Excel(エクセル) ExcelデータのMacとWindowsの文字化け対策について教えてください‼︎ 私はMacを使って 1 2022/08/22 12:46
- その他(ブラウザ) テキストの折り返しがないサイトの文字を折り返してPDF化したい 4 2022/12/02 09:49
- Word(ワード) テキストデータのPDFをWordで開くとテキストが図として認識されてしまう 3 2023/01/24 11:38
- その他(プログラミング・Web制作) 2つのテキストファイルを比べて文字列を特定する方法を教えて下さい 5 2022/05/01 15:22
- システム CSVファイルのマッピング処理の省力化 1 2022/11/24 00:01
- PDF 「PDF文書を簡単にWordで編集する方法」と 罫線が 図形で出力されるのは? 6 2022/06/14 06:51
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Word文書に、チェックマーク(...
-
JISコードとIMEパッドについて
-
ノートに、ある漢字を書き続け...
-
リットルを表示させたいんです...
-
至急お願いします!! Wordで、...
-
A4サイズの紙いっぱいに1文...
-
Thunderbirdの添付ファイル名に...
-
EXCEL97でラテン文字を入力する...
-
Word で項目番号 ○の21 から...
-
今更ながら小さい文字の打ち方
-
文字にうりよくで、〜いれると1...
-
エクセルの「IF」の結果の文...
-
タイピングしている映像の作り方
-
文字種(漢字・ひらがな・カタ...
-
DXFをAutoCADで開くと文字位置...
-
パワーポイント2003 文字...
-
Word IMEパッドから漢...
-
ここの質問サイトでの使用でき...
-
Adobe Premire(プレミア)内で変...
-
【WinSCP】フォルダ名が「能ソ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Word文書に、チェックマーク(...
-
“髙”という字の出し方教えてく...
-
word の文字入力 文字が青色に...
-
AUTO-CADで文字の太さを太くす...
-
Shift_JISで表示できて、UTF-8...
-
CASE MARKの表記方法について
-
漢字を出したい!
-
DXFをAutoCADで開くと文字位置...
-
ノーツ送信する際の多言語mine...
-
PDFまたはTIFFファイルに文字を...
-
Thunderbirdの添付ファイル名に...
-
エクセルの「IF」の結果の文...
-
「~が言うには」の違う言い方
-
Word で項目番号 ○の21 から...
-
1分間に何文字打てるか
-
「てぃ」という文字をローマ字...
-
文字にうりよくで、〜いれると1...
-
ファイル名で最後に認識される文字
-
AutoCAD 複数の文字を1つの文字...
-
こう言うのってエクセルから出...
おすすめ情報