
No.4ベストアンサー
- 回答日時:
元々の透明化されたテキストの認識率が90%程度なので、意味が取れない箇所が出てくるでしょうね
それを承知の上でよいのなら、後はPDFのセキュリティー設定しだいです。
何も制限を掛けていないなら、PDFを適当なヴューワで開き、後は「全て選択」「コピー」適当なテキスト・エディタに「貼り付け」れば、テキスト・データだけ取り出せます。
但し、行末に改行が入っているので、そのままでは読みにくいかもしれません。
この回答へのお礼
お礼日時:2011/08/14 14:43
休日の貴重なお時間を割いていただきありがとうございます。
アドバイスいただいたとおり、PDFを開いて全て選択、コピーしてテキス・エディタに貼り付けましたらテキスト化出来ました。
ご指摘の通り、識字率の問題・レイアウトの問題がありますが、テキスト保存できることを確認致しました。
誠にありがとうございました。
No.3
- 回答日時:
言うまでもないことですが、コマンドラインツールですよ。
プロンプトから
pdftotext input.pdf output.txt
などと指定しましょう。
大量に pdf ファイルがある場合は適当にバッチファイルを作るなりしてください。
No.2
- 回答日時:
この回答への補足
度々お手数をおかけいたします。
ダウンロードし実行致しましたが何事も起きません。
当方、Windows7 64bit版のためでしょうか。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
人気Q&Aランキング
-
4
イラレでダブルクリックで文字...
-
5
PDF→CSVへ変換
-
6
Illustratorテキストエリアへ塗...
-
7
サクラエディタで二つのテキス...
-
8
パワーポイントでテキストボッ...
-
9
バイナリファイルの編集
-
10
AFTER EFFECTS アンカーポイン...
-
11
フォトショップで複数テキスト...
-
12
リッチテキストと標準テキスト...
-
13
iMovieでテキストと画像を同時...
-
14
バイナリデータとテキストデー...
-
15
Illustrator CS5 営業の「営」...
-
16
photoshopのテキスト再編集
-
17
【aviutl】 画像にテキストを張...
-
18
エディタのkateで下線・太字・...
-
19
VBA:水平スクロールバーが要ら...
-
20
イラストレータをパワーポイン...
おすすめ情報
公式facebook
公式twitter