重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

【GOLF me!】初月無料お試し

こんにちは。

業者の方にお願いし、書籍を300冊ほどPDF化しました。それを受け取った後、Acrobat Pro 9を使用し自分でOCRを掛けたのですが、縦書きの検索がどうもうまくいきません。

検索にAcrobatを使用すれば問題ないのですが、他のアプリで試すと、ページ本文内の縦書きは一切、検索結果に表示されません。
代わりに、各ページの上部にある横書き部分(見出しや、タイトル名)に検索キーワードがある場合、それがヒットします。

これは、OCR時の設定に問題があるのでしょうか? それとも、検索するアプリが縦書きの検索に対応していないと考えるべきなのでしょうか?
(マック環境なので、プレビューとスポットライトで試しました)

詳しい方、いらっしゃいましたら宜しくお願いします。
M

A 回答 (4件)

もうだいぶ質問の時から時間がたってしまいましたが,同じ悩みを持つ方が検索でここにたどり着くこともあるかと思いますので(私もそうでした),書いておきます。



実は私も全く同じ症状で困っていました。ScanSnapで自炊した本を,iPad上で主にGoodReaderを用いて読もうと思っていたのですが,Mac上で問題なく検索できる縦書きのOCR済みPDFファイルが,iPadのGoodReaderの検索に全くかかりません。横書きの本や縦書きの本の中にある図表ないの横書き文字は検索されます。

どうも,iPad,iPhone上のアプリでは,まともに縦書きPDFファイルの検索に対応しているアプリがないようです。

質問者さんの挙げておられるiBooksも
http://books.campur.com/archives/438
に,縦書きのPDFは検索できないと書いてあります。

私が見つけた,唯一縦書き検索に対応しているiPadのアプリとしては,「Bookman(無料)」がありました。しかし,これにも問題があります。

(1)検索スピードが異様に遅い。普通の新書1頁を検索するのに5秒くらいかかるので,200頁程度の全文検索には,15分くらいかかってしまいます。

(2)なぜか,OCRをAcrobat8でかければ検索にかかりますが,ScanSnap Managerでかけると,横書き以外,全く反応しません。OCRをかけるアプリケーションによっても違いが出るというのは困ったものです。やはりAcrobatを使っておくのが無難なのでしょうか?

素人には,横でできるものがどうして縦でできないのか理解不能ですが,兎に角,現状では難しいようです。

実は私自身はデジタル物に疎いので,他の方の訂正,追加情報を期待します。
    • good
    • 0
この回答へのお礼

投稿してから見つけたサイトの中に(url 探してみましたが見つかりませんでした)「 MacはOSレベルでは縦書きをサポートしていないので、縦書き検索をするには、アプリが個別に対応している必要がある」と書かれていました。

OS X で対応されていないうことであれば、iOSでもされていないと考えるのが当然だと思うので、自分としては、現状ほとんどのアプリで検索できない事にも納得できました。Apple側の対応を待つしかない、ということでしょうかね。。

ご回答ありがとうございました。

お礼日時:2011/03/08 07:33

MacでAcrobat Proで縦書きって一番悪い組み合わせです



はっきり言って駄目ですよ、あきらめましょう^^

PDFなんでそのまま読みましょうね、OCRだと識字率が悪いから
    • good
    • 0

まずAcrobatでは駄目な理由を明確にしてください


Acrobatが一番適切なアプリです

この回答への補足

理由ですが、pdf化した書籍はパソコンではなく、iPadで読む予定です。

現在、縦書きpdfの検索に対応しているアプリがあるのかは、まだ調べていませんが、iBooksは横書きならpdfでも検索が可能で、今後アプリ自体がepubファイルの縦書き表示に対応するのに従い、縦書き検索も可能になると思います。

その際の二度手間を防ぐために、いま自分の手順が間違えているのであれば教えて下さい、ということです。

補足日時:2011/02/01 12:32
    • good
    • 0

なぜ、加工利用を想定していたのに、PDFにしたしまったのですか?、これは印刷イメージの意味ですよ。

二次加工には、向かないのです。意味を理解していますか?。

本来は、書籍300冊、業者に頼むなら、テキスト文にしてもらえばよかったのに。

PDFの文章の検索なて、どう考えても、うまくいくはずがありませんよ。

PDFを、OCR、テキスト文に直しているかなにかしているのですか、二度手間、三度手間を感じます。

この回答への補足

あまり、詳しくないのは事実ですが、手順が間違えてるとも思えません。

OCRテキスト認識では、スキャナなどで取り込んだ画像形式のPDFを検索可能な文字列として変換させる機能です。
http://blog.m-school.biz/article/122983491.html

また、頼んだ業者さんでも同じ手順を踏んでいるはずです。基本料金として(PDF化)一定額がまず設定されており、 オプションでOCRの追加が選べる形です。取り込みのスキャナーは持っていないのですが、acrobatは持っていたため、今回は自分でOCR処理することにしたのです。

また、PDF内の検索も横書きであれば、一切問題ありません。うまくいくはずがない、とはどういう意味でしょうか?

PDFにOCR処理をして、テキスト内検索は、googleなどで検索する限りとても一般的に思えます。今回は、それがうまく行かないのでここで尋ねているのです。

補足日時:2011/02/01 12:51
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!