透明テキスト付きPDFから任意の複数ページのテキストを一括して抽出できますか。

たとえば10ページのPDFから最初の5ページのテキストだけ抽出できますか。

1ページづつ5回テキストの抽出をするのが面倒でこまってます。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

そのものズバリのページ指定での抽出はできませんが、Adobe Readerならテキストとして保存ができるので、保存後不要なテキストを削除します。



非連続ページの場合はあまり効率的ではないかもしれませんが、連続ページならこれで十分簡略化できるのではないでしょうか?

Acrobatをお使いなら最初に不要なページを削除しておいてから、名前を付けて保存でテキスト形式で保存すればよいのではないかと思います。もちろん元ファイルのコピーをとっておいてくださいね。
    • good
    • 0
この回答へのお礼

ありがとうございます。

テキスト全部抽出して、いらないとこ捨てるほうが効率的ですね。

もしくは金に物を言わせて、Acrobatもありかもしれません。(買えないけど)

お礼日時:2006/09/18 11:45

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qpdfファイルから抽出できるテキストと抽出できないテキスト

Acrobat6.0Prof.を用い、テキスト選択モードでCTRL+Aすると、選択できるテキストと選択できない「テキスト」があります。選択できない「テキスト」をなぜ「テキスト」と判断したかといいますと、超拡大表示(例:6400倍)してもエッジがギザギザにならず鮮明に表示されるからで、これは明らかにアウトラインフォントと思われます。
このような「テキスト」を抽出する方法について知りたい。

Aベストアンサー

通常、フォントのデータは文字コードだけ記されています。
それをシステムに同じフォントがあればその文字コードを
元にして表示します。
同じフォントがシステムにない場合、表示できませんので
アプリケーション側で違うフォントに置き換えるようなア
ラートが出て違うフォントで表示することになります。
その場合、レイアウトが崩れるので、PDFファイルにする
時にフォントの埋め込みというのをしてPDFファイルを作成
すれば、相手先のシステムにフォントが無くても同じレイ
アウトで表示する事ができます。
ただし、フォントによっては埋め込む事を許可しないフォ
ントもありますので、その場合、フォントをアウトライン
化して絵として貼り付けます。この絵はビットマップでは
ありませんので、拡大してもギザギザにはなりません。
(ドロー系とかベクトル系の絵です)

Q普通のPDFファイルを透明テキスト付きPDFに変換するソフト

普通のPDFファイルを透明テキスト付きPDFに変換するソフトを探しています。
できれば簡単に変換できてフリーソフトが良いのですが無ければ市販品でもかまいません(できるだけ簡単にできるものが良いです)
今は会社のコピー機(コニカ製)についているスキャナで見積書等をスキャンしていますが検索もできると作業効率がグーンとUPするので探しています。
よろしくお願いします。

Aベストアンサー

画像のみのPDFから直接OCRしてそのまま透明テキスト付きPDFに変換することが可能、というソフトがありました。

最初に紹介したソフトと同じ会社のソフトです。

やさしくPDF OCR v.2.0
http://pac.mediadrive.jp/pocr/

Q透明テキスト付きPDF制作について

複合機キャノンのMP830を使用しています。付属のソフトでPDFにしても透明テキスト付きPDF制作は、出来ますが、文字としての認識は低いので悩んでいます。また、出来ても一度取り込んでから保存作業をしなければなりません。
 一度に出来き、OCRの認識率が高いソフトはありませんか?
 私の調べたところではソースネクストの「いきなりPDF」、AIソフトの「ScanPaper for PDF」があるみたいですがMP830には、対応していみたいです。他に探せなかったのでご存じの方、使用されている方教えてください。
 目的としては、読み込んだデータをPDFにして、単語の検索をかけたいだけです。Wordとかに文章を持ち込むことは、あまり考えていません。
 よろしくお願いします。

Aベストアンサー

AIソフトの「読んdeココ」はどうですか。
ナビゲーション機能(ワンボタンでPDFを作る)の「AI Smart Scan パネル」はキャノンの複合機でも動作するようですが、サイトの情報が古く新機種の動作確認はしてないようです。

http://ai2you.com/ocr/product/koko13/reason.asp

他には、PDFの本家本元アドビの「Adobe Acrobat 8 Standard」
OCR機能は「読んdeココ」と同じで、最新のPDF機能を利用できます。
透明テキスト付きPDFは Acrobat6で登場した技術です。

http://www.adobe.com/jp/products/acrobat/

Qスキャナで作成したPDFからテキスト抽出

会社で過去の書類を大量にスキャナでPDFにしてあります。(数千ファイル程度)
これらに中身がわかるようなファイル名を付けるために、PDFの中身を見てファイル名を付けるという作業をやることになりました・・・
それでどなたかご存知であればお教え願いたいのですが、下記要件を満たすソフトウェアはありませか?

・スキャナで作成したPDF(つまり画像ですね)からOCR的にテキストを抽出できる。
・コマンドラインで動作する。(数が多いのでプログラムを書いて自動化したいのです)
・価格は5万円以内(できたら2万円以内です。購入は自腹になると思いますので、これ以上は厳しいです)

Aベストアンサー

手書きをスキャンしただけですよね?
OCRソフト使っても、一件一件誤字確認しないとかなり難しいと思いますよ?
試しに数件ORCしてみて認識具合いろんなソフトで確かめたほうが良いかと思います。
また、ダイレクトに処理できなくても、PDFファイルを一括でOCR処理。
OCR処理したファイルをVBで作ったアプリケーションで一括処理でも工数敵に変わらないと思います。

QA4サイズで4ページ分のPDFファイルを、A3サイズ2ページのPDFフ

A4サイズで4ページ分のPDFファイルを、A3サイズ2ページのPDFファイルにしたい(A4サイズの2ページを並べてA3サイズ1ページのファイルにする形です)のですが、どうすればできるでしょうか?

Aベストアンサー

PDF作成のソフトによって違うかと思いますが、ページサイズをA3にして、2ページを1ページに割り付けるとできます。
PrimoPDFでは印刷→プロパティからLayoutタブのPages per Sheetを2に、Paper/QualityタブのAdvancedからPaper sizeをA3にするとできます(英語版を使っているので、日本語では多少違うかもしれません)。


人気Q&Aランキング

おすすめ情報