

こんにちは。
業者の方にお願いし、書籍を300冊ほどPDF化しました。それを受け取った後、Acrobat Pro 9を使用し自分でOCRを掛けたのですが、縦書きの検索がどうもうまくいきません。
検索にAcrobatを使用すれば問題ないのですが、他のアプリで試すと、ページ本文内の縦書きは一切、検索結果に表示されません。
代わりに、各ページの上部にある横書き部分(見出しや、タイトル名)に検索キーワードがある場合、それがヒットします。
これは、OCR時の設定に問題があるのでしょうか? それとも、検索するアプリが縦書きの検索に対応していないと考えるべきなのでしょうか?
(マック環境なので、プレビューとスポットライトで試しました)
詳しい方、いらっしゃいましたら宜しくお願いします。
M
No.4ベストアンサー
- 回答日時:
もうだいぶ質問の時から時間がたってしまいましたが,同じ悩みを持つ方が検索でここにたどり着くこともあるかと思いますので(私もそうでした),書いておきます。
実は私も全く同じ症状で困っていました。ScanSnapで自炊した本を,iPad上で主にGoodReaderを用いて読もうと思っていたのですが,Mac上で問題なく検索できる縦書きのOCR済みPDFファイルが,iPadのGoodReaderの検索に全くかかりません。横書きの本や縦書きの本の中にある図表ないの横書き文字は検索されます。
どうも,iPad,iPhone上のアプリでは,まともに縦書きPDFファイルの検索に対応しているアプリがないようです。
質問者さんの挙げておられるiBooksも
http://books.campur.com/archives/438
に,縦書きのPDFは検索できないと書いてあります。
私が見つけた,唯一縦書き検索に対応しているiPadのアプリとしては,「Bookman(無料)」がありました。しかし,これにも問題があります。
(1)検索スピードが異様に遅い。普通の新書1頁を検索するのに5秒くらいかかるので,200頁程度の全文検索には,15分くらいかかってしまいます。
(2)なぜか,OCRをAcrobat8でかければ検索にかかりますが,ScanSnap Managerでかけると,横書き以外,全く反応しません。OCRをかけるアプリケーションによっても違いが出るというのは困ったものです。やはりAcrobatを使っておくのが無難なのでしょうか?
素人には,横でできるものがどうして縦でできないのか理解不能ですが,兎に角,現状では難しいようです。
実は私自身はデジタル物に疎いので,他の方の訂正,追加情報を期待します。
投稿してから見つけたサイトの中に(url 探してみましたが見つかりませんでした)「 MacはOSレベルでは縦書きをサポートしていないので、縦書き検索をするには、アプリが個別に対応している必要がある」と書かれていました。
OS X で対応されていないうことであれば、iOSでもされていないと考えるのが当然だと思うので、自分としては、現状ほとんどのアプリで検索できない事にも納得できました。Apple側の対応を待つしかない、ということでしょうかね。。
ご回答ありがとうございました。
No.3
- 回答日時:
MacでAcrobat Proで縦書きって一番悪い組み合わせです
はっきり言って駄目ですよ、あきらめましょう^^
PDFなんでそのまま読みましょうね、OCRだと識字率が悪いから
No.2
- 回答日時:
まずAcrobatでは駄目な理由を明確にしてください
Acrobatが一番適切なアプリです
この回答への補足
理由ですが、pdf化した書籍はパソコンではなく、iPadで読む予定です。
現在、縦書きpdfの検索に対応しているアプリがあるのかは、まだ調べていませんが、iBooksは横書きならpdfでも検索が可能で、今後アプリ自体がepubファイルの縦書き表示に対応するのに従い、縦書き検索も可能になると思います。
その際の二度手間を防ぐために、いま自分の手順が間違えているのであれば教えて下さい、ということです。
No.1
- 回答日時:
なぜ、加工利用を想定していたのに、PDFにしたしまったのですか?、これは印刷イメージの意味ですよ。
二次加工には、向かないのです。意味を理解していますか?。本来は、書籍300冊、業者に頼むなら、テキスト文にしてもらえばよかったのに。
PDFの文章の検索なて、どう考えても、うまくいくはずがありませんよ。
PDFを、OCR、テキスト文に直しているかなにかしているのですか、二度手間、三度手間を感じます。
この回答への補足
あまり、詳しくないのは事実ですが、手順が間違えてるとも思えません。
OCRテキスト認識では、スキャナなどで取り込んだ画像形式のPDFを検索可能な文字列として変換させる機能です。
http://blog.m-school.biz/article/122983491.html
また、頼んだ業者さんでも同じ手順を踏んでいるはずです。基本料金として(PDF化)一定額がまず設定されており、 オプションでOCRの追加が選べる形です。取り込みのスキャナーは持っていないのですが、acrobatは持っていたため、今回は自分でOCR処理することにしたのです。
また、PDF内の検索も横書きであれば、一切問題ありません。うまくいくはずがない、とはどういう意味でしょうか?
PDFにOCR処理をして、テキスト内検索は、googleなどで検索する限りとても一般的に思えます。今回は、それがうまく行かないのでここで尋ねているのです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Visual Basic(VBA) VBAでPDFのアクティブページ番号取得 1 2023/05/25 12:41
- ホームページ作成・プログラミング パスワードつきホームページ トップページ以下はどうなる 6 2022/08/16 12:04
- Google+ スマホやインターネットに関してお詳しい方 1 2022/03/24 14:10
- Excel(エクセル) PHPプログラムをエクセルに張り付けると検索ボックスがでてくる! 3 2022/05/08 07:10
- WordPress(ワードプレス) WordPressのサイトにPDFをアップロードした際にGoogleなどの検索結果に出ないでほしい 1 2022/08/03 10:44
- Chrome(クローム) Chromeのアドレスバーに履歴等を表示させないようにしたい 2 2022/09/08 14:20
- アプリ 【ChatGTP】Androidアプリで1番おすすめのChatGTPアプリを教 1 2023/03/10 06:55
- その他(ブログ) ブログを始めたいと思うのですが、下記のような場合のおすすめブログサービスを教えてください。 収益化な 4 2023/04/10 10:01
- SEO 検索エンジン反映遅い 1 2022/06/04 07:35
- 建築士 建築士製図試験での縦距離の数値の書き方を教えて下さい 3 2023/07/16 11:36
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
最近家具などをGoogle検索かけ...
-
【TeraPad】文書内で連続検索で...
-
完全一致検索で出てこない現象
-
PDF中のURLをクリックしてもそ...
-
Windows7 の検索エンジン
-
もっと楽しくGoogle Earthを使...
-
検索結果一覧の名前の左上にあ...
-
Googlechrome拡張機能 Shazamが...
-
1ピクセルって何ミリですか?
-
エクセルウィンドウのサイズ変...
-
becky2の本文表示エリアの背景...
-
「フォーム再送信の確認」中の...
-
サンダーバードの検索欄が消えた。
-
リンクをクリックするとダウン...
-
http://jpg4.us/
-
outlookのツールバーが縦になっ...
-
youtubeの右上の広告を消す方法...
-
右上のX(閉じる)_(縮小)...
-
弥生会計 管理者パスワード忘れた
-
Mac用Firefoxのツールバー、サ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Microsoft Rewardのアクティビ...
-
【TeraPad】文書内で連続検索で...
-
最近家具などをGoogle検索かけ...
-
書籍PDF化:縦書き検索ができな...
-
PDF中のURLをクリックしてもそ...
-
iPhone 不審な表示
-
右クリックしてテキストを選択...
-
Googlechrome拡張機能 Shazamが...
-
Windows7 の検索エンジン
-
YahooJapanで特定の名前をNGに...
-
ファイルメーカー検索時のカー...
-
検索結果一覧の名前の左上にあ...
-
完全一致検索で出てこない現象
-
gooは面倒?
-
iPhoneのプライベートモードに...
-
同じ検索ワードを打っても、ブ...
-
Search resultsについて
-
ヤフージャパンきっずと普通の...
-
WindowsXP SP2 IE7.0でGoogleツ...
-
Firefoxで右クリックからweb検...
おすすめ情報