透明テキスト付きPDFから任意の複数ページのテキストを一括して抽出できますか。

たとえば10ページのPDFから最初の5ページのテキストだけ抽出できますか。

1ページづつ5回テキストの抽出をするのが面倒でこまってます。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

そのものズバリのページ指定での抽出はできませんが、Adobe Readerならテキストとして保存ができるので、保存後不要なテキストを削除します。



非連続ページの場合はあまり効率的ではないかもしれませんが、連続ページならこれで十分簡略化できるのではないでしょうか?

Acrobatをお使いなら最初に不要なページを削除しておいてから、名前を付けて保存でテキスト形式で保存すればよいのではないかと思います。もちろん元ファイルのコピーをとっておいてくださいね。
    • good
    • 0
この回答へのお礼

ありがとうございます。

テキスト全部抽出して、いらないとこ捨てるほうが効率的ですね。

もしくは金に物を言わせて、Acrobatもありかもしれません。(買えないけど)

お礼日時:2006/09/18 11:45

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qmysql_queryで取得したデータと外部のテキストファイルをマッチングしたい

mysqlに次のようなテーブルがあります。

テーブル名 : meibo

id | name
1 | 阿部
2 | 佐藤
3 | 橋本


そして次のようなテキストファイルがあります。

ファイル名 : blood.txt

1,A
2,B
3,O


テーブルのidとテキストファイルの数字を共通項として連携したいのですが可能でしょうか?

具体的には、phpファイルでmysqlからデータを取り出し、blood.txtとマッチングさせて表示したいと思っています。

例えば、次のように記述箇所がある場合、どこでblood.txtとマッチングすることができるでしょうか?

$rs = mysql_query("select * from meibo ;"$con);

while($rec = mysql_fetch_array($rs, MYSQL_ASSOC)){

echo $rec['name'];

//ここに血液型を表示させたい


}


それとも、そもそもこのようなことはできないのでしょうか?

よろしくお願いします。

mysqlに次のようなテーブルがあります。

テーブル名 : meibo

id | name
1 | 阿部
2 | 佐藤
3 | 橋本


そして次のようなテキストファイルがあります。

ファイル名 : blood.txt

1,A
2,B
3,O


テーブルのidとテキストファイルの数字を共通項として連携したいのですが可能でしょうか?

具体的には、phpファイルでmysqlからデータを取り出し、blood.txtとマッチングさせて表示したいと思っています。

例えば、次のように記述箇所がある場合、どこでblood.txtとマッチングするこ...続きを読む

Aベストアンサー

blood.txtを
$blood=Array(1=>'A',2=>'B',3=>'C');
となるよう配列に読み込んでおき

$rec['id']にidが入るのでそれをもとに
echo $blood[$rec['id']];
で表示できるでしょう

ていうか、血液型はSQLのテーブルで管理するのが普通の流れでしょうけど

Qpdfファイルから抽出できるテキストと抽出できないテキスト

Acrobat6.0Prof.を用い、テキスト選択モードでCTRL+Aすると、選択できるテキストと選択できない「テキスト」があります。選択できない「テキスト」をなぜ「テキスト」と判断したかといいますと、超拡大表示(例:6400倍)してもエッジがギザギザにならず鮮明に表示されるからで、これは明らかにアウトラインフォントと思われます。
このような「テキスト」を抽出する方法について知りたい。

Aベストアンサー

通常、フォントのデータは文字コードだけ記されています。
それをシステムに同じフォントがあればその文字コードを
元にして表示します。
同じフォントがシステムにない場合、表示できませんので
アプリケーション側で違うフォントに置き換えるようなア
ラートが出て違うフォントで表示することになります。
その場合、レイアウトが崩れるので、PDFファイルにする
時にフォントの埋め込みというのをしてPDFファイルを作成
すれば、相手先のシステムにフォントが無くても同じレイ
アウトで表示する事ができます。
ただし、フォントによっては埋め込む事を許可しないフォ
ントもありますので、その場合、フォントをアウトライン
化して絵として貼り付けます。この絵はビットマップでは
ありませんので、拡大してもギザギザにはなりません。
(ドロー系とかベクトル系の絵です)

Qパワーポイント2007のテキスト一括抽出方法

パワーポイント2007を使用しています。全てのテキストボックスを選択した後、全てのテキストボックス内のすべてのテキストを一括抽出して、そのテキストをワードに貼りつけたいのですが、その抽出方法がわかりません。教えてください。

Aベストアンサー

テキストボックス内のテキストは"セクション"で囲われているため、そのままでは
コピペ(抽出も)できません。

一度パワーポイント側で、Webページとして保存してからブラウザで開いてみてください。
そうすればセクションが外れて、テキストのみコピーできると思います。
(ただし、書式情報は残りますので、ワードに貼り付けた後修正してください。)

ブラウザの種類、バージョンによっては直接開けたりもしますが、上記の方法であれば
確実です。

Q普通のPDFファイルを透明テキスト付きPDFに変換するソフト

普通のPDFファイルを透明テキスト付きPDFに変換するソフトを探しています。
できれば簡単に変換できてフリーソフトが良いのですが無ければ市販品でもかまいません(できるだけ簡単にできるものが良いです)
今は会社のコピー機(コニカ製)についているスキャナで見積書等をスキャンしていますが検索もできると作業効率がグーンとUPするので探しています。
よろしくお願いします。

Aベストアンサー

画像のみのPDFから直接OCRしてそのまま透明テキスト付きPDFに変換することが可能、というソフトがありました。

最初に紹介したソフトと同じ会社のソフトです。

やさしくPDF OCR v.2.0
http://pac.mediadrive.jp/pocr/

Qテキストボックスのグループ化の方法(word2003)

word2003を使用して名刺を作成しています。テキストボックスをグループ化したいのですが、shiftキーを使っても、複数のテキストボックスを選ぶことができません。方法を教えてください。

また、クリップアートとテキストボックスをグループ化する方法があれば、教えてください。

Aベストアンサー

Word2003のテキストボックスは「テキスト編集状態」と「描画オブジェクト状態」でボックスの外回りの縞模様が異なります。

で、グループ化するには、「描画オブジェクト状態」で複数選択する必要があります。
ボックスの枠線上にマウスポインタを持っていくと、「I」の形から十字矢印に変わりますので、十字矢印の状態でクリックしてください。(2個目以降は「Shift」キーを押しながらクリック。)

これができれば、クリップアートやワードアートとのグループ化もできるはずです。

Q透明テキスト付きPDF制作について

複合機キャノンのMP830を使用しています。付属のソフトでPDFにしても透明テキスト付きPDF制作は、出来ますが、文字としての認識は低いので悩んでいます。また、出来ても一度取り込んでから保存作業をしなければなりません。
 一度に出来き、OCRの認識率が高いソフトはありませんか?
 私の調べたところではソースネクストの「いきなりPDF」、AIソフトの「ScanPaper for PDF」があるみたいですがMP830には、対応していみたいです。他に探せなかったのでご存じの方、使用されている方教えてください。
 目的としては、読み込んだデータをPDFにして、単語の検索をかけたいだけです。Wordとかに文章を持ち込むことは、あまり考えていません。
 よろしくお願いします。

Aベストアンサー

AIソフトの「読んdeココ」はどうですか。
ナビゲーション機能(ワンボタンでPDFを作る)の「AI Smart Scan パネル」はキャノンの複合機でも動作するようですが、サイトの情報が古く新機種の動作確認はしてないようです。

http://ai2you.com/ocr/product/koko13/reason.asp

他には、PDFの本家本元アドビの「Adobe Acrobat 8 Standard」
OCR機能は「読んdeココ」と同じで、最新のPDF機能を利用できます。
透明テキスト付きPDFは Acrobat6で登場した技術です。

http://www.adobe.com/jp/products/acrobat/

Qフォルダ名やファイル名、テキストドキュメント名のタイトルだけコピーする方法?

前から面倒でタイトルのようにフォルダ名やファイル名をコピーする方法
がないのかなと思っていたのですが、なにか良い方法はないでしょうか?
またテキストドキュメントもよく利用するのですが、そのままテキストドキュメントの
コピーではなくタイトルだけコピーして、別のテキストドキュメントのタイトルにタイトルだけ
コピーする方法はないのでしょうか?

よく、一部だけ変更して別のテキストドキュメントに保存するのですが
そうするとタイトルが長くなり、タイトルつけるだけでも結構面倒に
なるので、タイトルだけコピーしてタイトルを一部変更して
保存できれば楽だなと思ったのですが、なにか良い方法は
ないでしょうか?

つまり、新規テキストドキュメント>タイトル消す>別に作成したテキストドキュメントから
タイトルだけコピー>さっき消した新規テキストドキュメントのタイトルに貼り付け>
>タイトル一部変更保存>という流れでやりたいのですが。

応用してフォルダ名だけコピーファイル名だけコピーとかできれば面倒でなくなるのですが。

説明がわかりづらいと思いますが良い方法があれば回答よろしくお願いします。

前から面倒でタイトルのようにフォルダ名やファイル名をコピーする方法
がないのかなと思っていたのですが、なにか良い方法はないでしょうか?
またテキストドキュメントもよく利用するのですが、そのままテキストドキュメントの
コピーではなくタイトルだけコピーして、別のテキストドキュメントのタイトルにタイトルだけ
コピーする方法はないのでしょうか?

よく、一部だけ変更して別のテキストドキュメントに保存するのですが
そうするとタイトルが長くなり、タイトルつけるだけでも結構面倒に
なる...続きを読む

Aベストアンサー

[名前を付けて保存]ダイアログで、既存のファイルから[ファイル名]を
コピーしたいのですね。
以下で説明する私が使っている方法でよければ試してみてください。

[名前を付けて保存]→[名前を付けて保存]ダイアログにて保存をしたい
フォルダが開いた状態にする→[ファイル名]でカーソルが点滅した状態
でコピーしたいファイル名を右クリック→[ファイル名]に名前がコピー
されたら一部を変更して[保存]。

上記手順で右クリックしたときに右クリックメニューが表示されますが
そのまま[ファイル名]のところをクリックすれば消えますので変更する
部分だけ追加などをします。

Qスキャナで作成したPDFからテキスト抽出

会社で過去の書類を大量にスキャナでPDFにしてあります。(数千ファイル程度)
これらに中身がわかるようなファイル名を付けるために、PDFの中身を見てファイル名を付けるという作業をやることになりました・・・
それでどなたかご存知であればお教え願いたいのですが、下記要件を満たすソフトウェアはありませか?

・スキャナで作成したPDF(つまり画像ですね)からOCR的にテキストを抽出できる。
・コマンドラインで動作する。(数が多いのでプログラムを書いて自動化したいのです)
・価格は5万円以内(できたら2万円以内です。購入は自腹になると思いますので、これ以上は厳しいです)

Aベストアンサー

手書きをスキャンしただけですよね?
OCRソフト使っても、一件一件誤字確認しないとかなり難しいと思いますよ?
試しに数件ORCしてみて認識具合いろんなソフトで確かめたほうが良いかと思います。
また、ダイレクトに処理できなくても、PDFファイルを一括でOCR処理。
OCR処理したファイルをVBで作ったアプリケーションで一括処理でも工数敵に変わらないと思います。

Qテキストデータを開いて指定したエクセルシートに貼り付ける方法

質問です。テキスト形式で保存したデータが約500あります。
以後
・テキストデータをテキスト1~テキスト500と呼びます
・貼り付けたいエクセルシートをシートと呼びます

1.まずテキスト1をエクセルで開きます
2.そしてエクセルで開いた、例えばB12~B18までのデータを
  シートのA1~A7に貼り付けます
3.次にテキスト2をエクセルで開き、今度はB12~B18までのデータを
  シートのB1~B7に貼り付けます
4.この作業を続けてテキストデータ500個を1つのエクセルシートに  順々に貼り付けていくにはどうすればいいでしょうか?

上記の操作において、エクセルで開いたテキストデータから抽出するデータの位置(アドレス?)はすべて同じです。上記の場合はB12~B18です。問題はエクセルシートに、テキストデータ1はA列に、2はB列に、3はC列にという様に貼り付けていく方法が知りたいです。
一つ一つやっているのですが、気が遠くなります。何かいい方法があればよろしくお願いします。

Aベストアンサー

マクロを使うと出来ます。

マクロが理解出来ているという前提で、お話しします。
(1)特定のファイルを特定の順序で開くには、
開くファイルを特定する為、それぞれのファイルのFullPathを取得する方法が必要です。
(2)開いたファイル別に列にコピーして貼り付けるためには、ファィルの数だけ列が必要ですが、エクセルシートの列の数は256で有限です。貼り付ける位置を再考する必要があります。
(3)コンピュータにとって、ファイルを開く(閉じる)という行為は、結構ハードな作業で、時間が掛かります。(作動速度の大きいコンピュータで作業する必要がある。)
(4)そのため、エクセルにはテキストファイルを開く時間を極小して開く方法が用意されていすが、この方法で開いたファイルから必要データを抽出して取得するプログラムが結構難しい。
(5)いろいろな問題があって、一筋縄ではありませんが、sdfaさんのやりたいことは、可能です。是非頑張って下さい。

QA4サイズで4ページ分のPDFファイルを、A3サイズ2ページのPDFフ

A4サイズで4ページ分のPDFファイルを、A3サイズ2ページのPDFファイルにしたい(A4サイズの2ページを並べてA3サイズ1ページのファイルにする形です)のですが、どうすればできるでしょうか?

Aベストアンサー

PDF作成のソフトによって違うかと思いますが、ページサイズをA3にして、2ページを1ページに割り付けるとできます。
PrimoPDFでは印刷→プロパティからLayoutタブのPages per Sheetを2に、Paper/QualityタブのAdvancedからPaper sizeをA3にするとできます(英語版を使っているので、日本語では多少違うかもしれません)。


人気Q&Aランキング