
Rubyでpdfファイルを読み込む方法を探しています。
file = open("sample.pdf", "r")
file.each { |f|
puts f
}
というコードを書いて実行すると文字化け?したようになったり、数字ばかりの行が挿入されていたりと、txt形式のファイルを読み込んだ時の様に文字が正しく出力されません。
何かpdfを読み込む正しい方法があるのでしょうか。
また、直接読み込むことはせずにpdftotext.exeを使って予めtxt形式に変換しようと考えたのですが、Rubyのスクリプトの中でpdftotext.exeを使う方法が分かりません。
解決方法をご存じの方がいらっしゃいましたら教えて頂けないでしょうか。
環境はWindowsです。よろしくお願いします。
No.1ベストアンサー
- 回答日時:
> pdftotext.exeを使って予めtxt形式に変換
コマンドラインで使用するコマンドをそのままsystemで実行すれば良いと思います。
-----
PDFTOTEXT = ' "c:\Program files\Xpdf\pdftotext.exe" '
OPT = ' -enc Shift-JIS'
filename = "foo.pdf"
system("#{PDFTOTEXT} #{OPT} #{filename}")
-----
ファイルパスやオプションは適宜修正が必要です。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ruby OpenURI::Meta
-
Ruby require ライブラリー
-
Accessで文字列のバイト数読み込み
-
VBScriptでExcel(2019)上のデー...
-
(再質問)エクセルのマクロボ...
-
英数字を含む文字列(0-9,A-Z)...
-
C言語の入力した文字を反転させ...
-
【メモリ不足で落ちる(python)】
-
WSLのUbuntuで、Railsのインス...
-
ruby while式
-
ruby loopメソッド 変数(再喝)
-
ruby 配列
-
ruby loopメソッド 変数
-
ruby クラス・オブジェクト・イ...
-
ルビー言語 ライブラリー 追記
-
ruby raise句
-
ruby begin句
-
ruby ensure句
-
ルビー言語 ライブラリー(再々...
-
ルビー言語 csvファイル 続き(...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
RubyでNo such file or directo...
-
rubyプログラムからrubyプログ...
-
Ruby interpreter (CUI) 2.2.3 ...
-
Rubyでの日本語コードの指定
-
RubyのBrain-Fxxk系言語について
-
スクリプトファイル名を取得す...
-
RubyでexeファイルをつくるExer...
-
小文字wと大文字Wの区別
-
ruby on railsインストールでエ...
-
プログラミング言語で大文字と...
-
COBOLのIFの入れ子について
-
VB.NETで階乗を求めるプログラ...
-
web上のhtmlファイルから文字デ...
-
画像をページ右側に並べる方法...
-
Xcodeでランダム整数
-
Pro*CとCの間|変数の有効範囲
-
プログラミング講師はまだ需要...
-
ruby の File.exist? メソッド...
-
たびたびすいません。VBAです。
-
Ruby / passenger のインストー...
おすすめ情報