プロが教える店舗&オフィスのセキュリティ対策術

音楽アルバムについている歌詞カードのPDFがあります。(もともとの歌詞カードはありません)

たまにPDF上の文字を選択し、コピーできるものもあるのですが、全く選択できないものがあります。

こういった全くコピーできないPDFの歌詞をコピーしテキストに落としこみたいのですが、よいソフトはないでしょうか?(多少文字化けしても構いませんが、、、)

以上、宜しくお願い致します。

A 回答 (3件)

#1さんに補足です。

画像から文字を認識する機能をOCRと言います。「OCRソフト」で検索すると色々見つかると思います。

例えば
e.Typist
OCRとは?
http://mediadrive.jp/products/et/index2.html
体験版ダウンロード
http://mediadrive.jp/products/et/index8.html
    • good
    • 0

 PDFは、異なるプラットホーム(OS,アプリケーション,フォント)に関わらず、作成者の意図どおりに表示印刷させるためのフォーマットで、よほど指定しない限りフォントも埋め込まれています。

たとえフォントが埋め込まれていなくてもテキストとしてデータを持っていて、かつコピー・抽出をブロックしていない限りテキストデータは取り出せるはずです。
 文字が選択できないには二つあって、
・そもそもコピーするメニューがない場合(ブロックがかけられている)
・文字が含まれていない
 のいずれかです。
 いずれも、画像からテキストを読み取るOCR(Optical Character Recognition光学文字認識)としいう文字認識アプリケーションが必要になります。PDFを作成するソフトの機能ではありません。一部スキャナソフトでOCR機能を持つものがあります。
 OCRは開発の難しいソフトで無償のものはないと思います。たくさんのOCRソフトがありますから、選択してください。
    • good
    • 0

テキストとして範囲選択できない場合は、たいてい、文字が画像化されて記録されています。



PDFの場合、見るパソコンによって見た目が変わってしまうと困るので「文字も画像になっている」事が多いのです。

文字が文字として入っていると、その文字に割り当てた「フォント」をインストールしてないパソコンで見た時、フォントが無い所為で「思った通りに表示されず、代わりのフォントで表示されてしまう」ので、困ります。

そういう訳で、範囲指定コピーの出来ない歌詞の文字は「画像になっている」ので、それをテキスト化するには「PDF変換ソフト」が必要になります。

画像化された文字も、ジャングルの「変換!PDF」や、ソースネクストの「いきなりPDF」などで変換、編集出来ると思います。

上記のような変換ソフトの幾つかは、ダウンロードでの体験版がありますから、ダウンロードして試用してみて、文字認識率が高そうなのを購入してみては?
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!