「これはヤバかったな」という遅刻エピソード

Androidスマートフォンで小説等を読むために、業者に依頼してPDF+透明化テキストしましたが、端末画面が小さくて読めません。
もちろん拡大すれば読めるのですが、スクロールするのは使い勝手が悪く、テキストビューワーなら表示フォントを大きくしてみることが出来ますが、PDF+透明化テキストされたファイルからテキストのみを抽出する方法を教えていただけないでしょうか。
フリーのソフトを希望します。
よろしくお願い致します。

A 回答 (4件)

元々の透明化されたテキストの認識率が90%程度なので、意味が取れない箇所が出てくるでしょうね



それを承知の上でよいのなら、後はPDFのセキュリティー設定しだいです。
何も制限を掛けていないなら、PDFを適当なヴューワで開き、後は「全て選択」「コピー」適当なテキスト・エディタに「貼り付け」れば、テキスト・データだけ取り出せます。
但し、行末に改行が入っているので、そのままでは読みにくいかもしれません。
    • good
    • 0
この回答へのお礼

休日の貴重なお時間を割いていただきありがとうございます。
アドバイスいただいたとおり、PDFを開いて全て選択、コピーしてテキス・エディタに貼り付けましたらテキスト化出来ました。
ご指摘の通り、識字率の問題・レイアウトの問題がありますが、テキスト保存できることを確認致しました。
誠にありがとうございました。

お礼日時:2011/08/14 14:43

言うまでもないことですが、コマンドラインツールですよ。


プロンプトから

pdftotext input.pdf output.txt

などと指定しましょう。
大量に pdf ファイルがある場合は適当にバッチファイルを作るなりしてください。

この回答への補足

お手数をおかけいたします。
どうも私のPC技量では無理のようです。
ありがとうございました。

補足日時:2011/08/14 12:04
    • good
    • 0

Xpdf


ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02pl5-win3 …

たぶんここ…。(直接ダウンロード)

この回答への補足

度々お手数をおかけいたします。
ダウンロードし実行致しましたが何事も起きません。
当方、Windows7 64bit版のためでしょうか。

補足日時:2011/08/14 11:17
    • good
    • 0

xpdf に付属の pdftotext を試してみましょう。

私は使ったことない。

この回答への補足

休日の貴重なお時間を割いていただきありがとうございます。
xpdfは存じ上げませんが、Windows7対応でしょうか。
検索しましたがexe本体のダウンロード先がよくわかりません。

補足日時:2011/08/14 10:22
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!