
卒論のデータ分析に使う大量のPDFを、縦半分に分割したいのですが、
大量のPDFを縦半分に分割できるフリーソフトをご存知の方、教えていただけませんか?
ちなみになぜこのようなことをしたいかというと、手元の縦置きA4サイズのPDFは縦に分割された(2段組み?)の文書になっていて、データ(文章)は「左上→左下→右上→右下」の順になっています。このPDFをテキスト抽出したかったのですが、抽出したデータはその順番には抽出できなかったので、一度縦半分に分割して、左半分→右半分の順にテキスト抽出すれば正しい順番のデータができるのでは、と考えたのですが。。。
何か良い方法があれば教えてください。
A 回答 (6件)
- 最新から表示
- 回答順に表示
No.6
- 回答日時:
No.3の回答者です。
A4サイズをA5サイズにするのではなく、A4縦方向に分割するのですね。
[印刷]でのプリンターの指定でPDFソフトを指定して、[プロパティ]から
特殊なサイズ(105×297)のものを指定することでできませんか?
ただ上記設定で分割できたとしても、気になるのは抽出したデータが順番
には抽出できなかったことです。
Wordなどで段組みしたものをテキストを埋め込みしてPDFファイルにした
ものなら、PDF内のテキストを選択すると段ごとに選択範囲ができます。
これをコピーすれば順番が変わることはありませんでした。
もしかしたら上記設定で分割しても、選択範囲として正しくコピーできる
とは思えないのですが。質問にあるようなPDFのデータが手元にないので、
私自身が検証作業ができないことから、確実に希望しているような分割に
なるかどうかわかりません。
透明テキストとして、コピーできるようなものだとしたら、希望している
分割はできないかもしれませんね。
No.5
- 回答日時:
No4です。
>テキストデータは埋め込まれており、コピーアンドペースト可能なのですが、2000ファイルもpdf
>があるので、一括で処理したいと考えております。
>例えば教えてくださったソフトでは一括処理は可能でしょうか?
・PDF-XChange Viewerでコピペなど操作できるのはファイル単位です。
・ページ全体を選択した場合、段単位で文字列が取得できるPDFと「左上→左下→右上→右下」の順に取得できるPDFがあります。
ですから、このままでは一括処理はできませんが、
もしも、お手元のファイルが、
前者のタイプのPDFである
ならば、
すべてのPDFファイルをまとめて1つのPDFファイルを作り、
それをファイル全体をCTRL-Aで選択して、CTRL-Cでコピペ
すれば可能と思いますが、こればっかりは試してみるしかわかりません。
ありがとうございます。
PDFはファイルごとにテキスト抽出したいと思っています。
おっしゃるように、一度すべての元pdfをマージして、テキスト変換したものを元pdfファイルの切れ目で分割するという方法がありそうですね!
調べてみます。
No.4
- 回答日時:
>何か良い方法があれば教えてください。
PDFファイルからテキスト抽出したいのですよね。
文字画像としてではなくテキストデータが埋め込まれているPDFであれば、フリーソフトの
PDF-XChange Viewer
の テキストツール で2段組みの1段分の文字を選択して CTRL-C すれば、クリップボードに文字データがコピーされますので、ワードファイルの上で CTRL-V すればテキストが取り出せますよ。
文字画像として保存されたPDFであれば、OCRで画像認識する必要がありますので、他の回答を参考にしてください。
http://www.forest.impress.co.jp/library/software …
ありがとうございます。
テキストデータは埋め込まれており、コピーアンドペースト可能なのですが、2000ファイルもpdf
があるので、一括で処理したいと考えております。
例えば教えてくださったソフトでは一括処理は可能でしょうか?
No.3
- 回答日時:
A4サイズ横向きでの1ページごとに、A5サイズ縦置きでの2ページごとへと
分割するということですよね。
ネット検索などで「PDF 1ページ 分割」などで調べれば、参考になる情報が
探せると思いますよ。
http://oshiete.goo.ne.jp/qa/6526998.html
http://www.koikikukan.com/archives/2012/01/16-00 …
http://mamesibaj.web.fc2.com/it/IT_PDF_002000.html
http://tanweb.net/2014/06/27/1234/
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Visual Basic(VBA) 【前回の続きです、ご教示ください】VBAの記述方法がわかりません。 2 2022/08/16 16:44
- AJAX ワードでA3横の画面にして、文字入力はA4縦にしたい 1 2023/05/04 13:59
- その他(パソコン・スマホ・電化製品) ギャラクシー tab S6で画面上下分割ができません。左右分割しか出来ない仕様なのでしょうか? 縦長 1 2022/08/03 08:27
- Safari(サファリ) 画面のサイズ 1 2023/05/28 14:00
- YouTube YouTubeの動画投稿 画面のサイズ変更方法 1 2023/01/27 19:25
- PDF いきなりPDFで文書の切り取り 3 2022/10/29 13:25
- その他(ブラウザ) webサイトに表示する画像の向きを変える(左右に回す)方法 3 2023/01/20 08:28
- バイク免許・教習所 教習所に通ってる者で、今回右左それぞれからのバック駐車・縦列駐車を行いました。 左右それぞれからのバ 2 2023/06/23 18:00
- Visual Basic(VBA) 複数ページあるPDFファイル内の文字列等の情報をキーにPDFをグループ分け分割したい。 2 2022/06/25 09:51
- ホームページ作成・プログラミング グリッドレイアウトHTMLとCSS 1 2023/02/22 02:36
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
複数ページのTIFファイルを分割...
-
質問です auの分割のローン審査...
-
1ページのpdfファイルを半分の2...
-
元々パソコンに入っているペイ...
-
DVD Shrinkで大容量のDVDは
-
WinZipで分割作成したzipファイ...
-
Acrobat ProXで1ページを2ペ...
-
メールが容量おおすぎで送れません
-
tapurでSkype録画が1分くらいし...
-
複数ページのtif分割
-
DVD Decrypterで、容量が大きす...
-
mp3をトラック分けできるフリー...
-
m2tsファイルのチャプター分割...
-
画像を半分に分割して、2枚の...
-
2時間前後の会議音声を圧縮しメ...
-
長時間録画したテレビ番組をDVD...
-
添付ファイルが分割されてしまう。
-
SoundEngineでのファイルの分割...
-
mp3DirectCutでカットした部分...
-
PDFをしおりを維持したまま分割...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
複数ページのTIFファイルを分割...
-
元々パソコンに入っているペイ...
-
1ページのpdfファイルを半分の2...
-
700MB以上のファイルをCD-...
-
PDFをしおりを維持したまま分割...
-
JW-CADで面積を等分割し...
-
住所録を市区町村、番地、建物...
-
DVDシュリンクが分割される事に...
-
Acrobat 9 でハイライトを一括...
-
WinZipで分割作成したzipファイ...
-
PDFファイル,最後から最初まで...
-
2時間前後の会議音声を圧縮しメ...
-
DVD DecrypterでISOファイルが...
-
エクセルのハイフンあり並べ替えで
-
複数ページのtif分割
-
1GBを超えたファイルをCD...
-
ファイルを複数のCD-Rに分割し...
-
Illustratorのぼかし(ガウス)の...
-
Flacファイルを分割したい
-
チャプター付きのMP4ファイルを...
おすすめ情報
ありがとうございます。
ただ私の手元に元データがなく、PDFからテキストデータを抽出せざるを得ない状況なので非常に困っているのです・・・。