アプリ版:「スタンプのみでお礼する」機能のリリースについて

また疑問ができました。
PDFファイルをAdobeReaderで読み込んだ後、PDF
ファイル内の見かけ上は文字を選択ツールから
ドラッグする時、文字の書いてある所をドラッグしても、
文字領域がテキストとしてクリップボードにコピーできる
ものと、同じようにドラッグしても画像(多分BMP)と
してしか文字領域が認識できないものがありますが、
これらのファイルの違いは何なのですか?
 最初に読み込むPDFファイルを作成(保存)する時にすでに
PDFでも形式が違う?またその元のPDFかAdobeReader
で開いた後でも何か操作をすれば、画像としてしかコピーできない
ものも、文字領域としてテキストとしてコピーできる様にする事は
出来るのでしょうか?
 またそのために何か(特別な)別のソフトが必要なのでしょうか?
長い文章ですみません。PDFは奥が深い(凹)ですね。
どうかよろしくお願いいたします。

A 回答 (2件)

PDFはPortable Document FormatというAdobeが開発したフォーマット形式です。

もともとは印刷用の形式(Postscript)で、どこに(WindowsからMacとか)持っていっても同じような見た目で表現出来る事に大きなメリットがあります。また、見る為のリーダーが無償配布されているので、共通プラットフォームとしてはとても有効です。

話が少しそれますが、WEBの共通ファイルのHTMLでは、タグでフォントの大きさや色等を指定していたり、画像があればココにこの大きさで画像を貼る、動画があればココに貼る、というような情報が書かれています。
PDFでは画像ファイルやその他の情報が一つのファイルに埋込まれています。普通やりませんが、PDFファイルをテキストエディタで開けば、テキストが埋込まれている事が分かります。テキスト以外はフォントの大きさや種類、色、位置等、同じ見た目にする為の情報が記録され、画像が貼付けられている場合は、画像の大きさや位置の他、画像のファイル自体(JPEG等)が埋込まれている訳です。
質問者さんの指摘通り、テキストとフォント種類等で書かれている場合はテキストが文字として選択出来ますが、画像の場合は単なる色と点情報でしかないので選択や検索は出来ません。

> 画像としてしかコピーできないものも、文字領域としてテキストとしてコピーできる様にする事は出来るのでしょうか?

出来ません。
意味は全く違いますが、目的を達成するには画像を文字認識させて文字に変換するOCRを使えばある程度自動的にテキストとして取り出す事は可能でしょう。当然、誤認識はあると思います。

参考まで。

この回答への補足

まずはご回答ありがとうございます。
【上記 taketan_mydns_jp さんのご回答】 と言うことは、言い回
しが理解されにくいかもしれませんが、PDFエディタ(仮に具体名
はわかりませんので)に画像を貼り付けてPDFで保存されたもの
と、テキストのデータ、文字を貼り付けると言う表現はおかしいで
すが、文字を直接?打ち込んだものや、テキストエディタなどから
コピペしたものをPDF形式で保存されたものの違いで、
出来上がってReaderでの見た目は同じ「PDF」でも中身の詳細情報
が画像から作成した「PDF」かテキスト(文字)から作成された
「PDF」の違いと言うことでしょうか?

補足日時:2007/05/11 12:40
    • good
    • 0
この回答へのお礼

丁寧なご回答ありがとうございました。
まず結論は出来ない、OCRでの処理が必要と言うことですね?
OCRソフトをいくつか試したのですが、文字を出来るだけ忠実に
読み取ろうとしますと、読み取るものの性能や読み込むファイル
自体が見た目でも読みづらいものを取り込んでの変換はかなり時間が
かかったので、では自分の持つ根本のPDFファイルを何とか
できないかと考えて質問までにいたりました(欲を言えば最初の
PDFを作るときに文字でPDFを扱えるように取り込むなりの
処理がしてあるものでしたら良かったのですが・・・)。
また何かありましたらよろしくお願いいたします。

お礼日時:2007/05/11 12:51

PDFファイルは作成時色々な制限をかけられるようになっています。



制限の内容はファイルを開いて、
ファイル>プロパティ>セキュリティタブで見ることができます。

この回答への補足

ご回答ありがとうございます。
ファイルを開くのはAdobeReaderでよいのでしょうか?
そこでセキュリティがかかっていたりすると制約が出てきたりして
編集などが出来ないようになっているのでしょうね。
そのためのセキュリティーでしょうから。
そこで情報の内容も見ることが出来るか(画像情報であったり、
テキスト情報であったり)確かめてみます。

補足日時:2007/05/11 12:53
    • good
    • 0
この回答へのお礼

ありがとうございました。
ものすごく細かなところの設定を知っていれば、設定を変更して
みたり他のソフトで読み直して別形式で保存しなおしたりして
うまくいくかな?とも思いましたが、やはり制約もあるのでしょうね。
考えが甘いですね。
また何かありましたらよろしくお願いします。

お礼日時:2007/05/11 13:03

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!