■理想の手順
1) Mac/iPhoneで大量のスクリーンショットをキャプチャする
※pngファイル、約1000枚
2) PDF等で一つのファイルにまとめ、一括でOCRテキスト認識
3) テキストのみを抜き出す
■困っている点
1枚くらいであれば苦なく上記作業ができるのですが
1000枚単位で同作業が必要なので
なんとか効率化できないかと悩んでおります。
テキストだけ抜き出せるなら、上記手順には拘りません。
■環境
Mac OS X 10.7.4 Lion
Acrobat 9 Pro
LibreOffice 3.5.4.2(OpenOffice後継)
ご教授のほど、よろしくお願いいたします。
No.1
- 回答日時:
確認ですが
>1) Mac/iPhoneで大量のスクリーンショットをキャプチャする
これwebページじゃ無いの?
webページなら別方法あるけど・・・・
教えてください。
この回答への補足
ご協力ありがとうございます!
Webページではなく
iPhoneアプリ内データのキャプチャや
Macのスクリーンショット機能(Cmd + Shift + 4)です。
Webページの場合は
どのような方法があるのでしょうか?
■以下、質問文への補足です
Office系のソフトに
大量png画像を挿入 → PDF化 → 一括でOCRテキスト処理
の流れで試したのですが、
LibreOfficeですと複数画像が挿入できない時点で頓挫しました。。
No.3
- 回答日時:
・GraphicConverterとか、Imagemagick等コマンドラインツールとかを使えば、「手作業」で一枚にする必要はなくなる
・AppleScriptとかAutomatorとかを使えば、他の「手作業」も自動化できるかもしれない。
「画像を一つにまとめる」作業無しにして、画像を1枚ずつOCRで処理することもできるかもしれない。
どこまでできるか、はそのOCRソフトの機能しだい。
この回答への補足
ご回答ありがとうございます!
>>「画像を一つにまとめる」作業無しにして、画像を1枚ずつOCRで処理することもできるかもしれない。
こちらが一番現実的かと思います。
AppleScript、Automatorは別件で
何度かトライしたことがあるのですが
Web上の文献では私には十分理解できませんでした。
もしご存知であれば、わかりやすい参考書などあれば
お手数ですが、お教え頂けると有難いです。
(本屋でも探してみたのですが、
昔の本が多く、購入をためらった経験があるので)
有益な本など無ければ、なんとかバッチ処理する手段を
試しまくろうと思います。
AppleScript、Automatorはいつか勉強したいです!
質問に対しても、解決法の方向性を示して頂き
大変助かりました。
有難う御座いました。
No.4
- 回答日時:
#1です。
webでなくアプリだと言うのは了解しました。
MACで何をキャプチャーしてるかは不明ですが・・・・
ご存知の通りWebは「html」で表示されるので表示後、タグの処理をどうするかで整理できます。
フリーソフトも存在してます。
ところで 何でOCR使うためにPDFの選択されてるのですか?
普通はjpgフォーマットで読めますが・・・・
あっ!
アドビのアクロバット内の「OCR」を使うことを前提にしてませんか?
そうならお望みの事は出来ません。
多数の書類を処理するなら「OCR」のみに特化したソフトを使うべきです。
出来れば有所プノソフトを!
販売店に相談されれば幾つかのソフト紹介してるれます。
ご回答頂き、ありがとうございました。
(新しいソフト好きなので)
「有所プノソフト」が引き続き、気になっております。。
ご協力頂き、誠に感謝申し上げます。
No.5ベストアンサー
- 回答日時:
>要は、複数枚のOCR可能な解像度の画像を
>如何に効率的にOCRできるかを
Acrobatを使うのでしたら、複数のファイルをバインドして
ひとつのファイルにするだけでは?
度々ありがとうございます!
chieffishさんからのアドバイスをヒントに
下記手順でほぼ理想の結果が得られました。
誠に有難う御座いました☆
==========================
1) Finderで複数のpngファイルを選択
2) 右クリック or コンテキストメニューで
「このアプリケーションで開く」を選択
3) Acrobat Proを選択
4) ダイアログ表示
「Acrobat は開いているすべての画像ファイルから
単一の文書を作成できます。
すべての画像ファイルを 1 つの文書にまとめますか?」
5) 複数pngファイルが一つのPDFファイルとして開かれる
6) OCR処理を実行
==========================
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Winmerge ファイルの中身は同じ...
-
同期センターのマークが出てま...
-
ファイルの先頭行を全て削除したい
-
バッチファイルで変数の中身を...
-
教えてください!困ってます。
-
バッチファイルからタスクスケ...
-
onedriveの中身を削除したらパ...
-
VScodeでjarファイルを開く方法
-
GnuPGの複合化をパスフレーズ手...
-
ファイルの単位
-
emlをtxtに変換するには?
-
フォルダ内の一覧を印刷するには?
-
コマンドプロンプトによるフォ...
-
クラリスワークスのファイルを...
-
mac 表示できなくなりました。
-
Excellにて→ファイルエラー:デ...
-
BAKファイルを非表示にする方法
-
ISOイメージとIMG+cueの違い
-
tarの中のtarを閲覧するには。。
-
PowerPoint 複数ファイルをス...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Winmerge ファイルの中身は同じ...
-
教えてください!困ってます。
-
onedriveの中身を削除したらパ...
-
同期センターのマークが出てま...
-
バッチファイルで変数の中身を...
-
ファイルの先頭行を全て削除したい
-
ファイルの単位
-
office365 ファイルを削除したい
-
Windows10 フォルダ内の自動並...
-
コマンドプロンプトによるフォ...
-
emlをtxtに変換するには?
-
クラリスワークスのファイルを...
-
macのdmgファイル(動画)をMP4...
-
mac ファイルの詳細情報を編集...
-
ODBCエラー「admin」によってロ...
-
.pkgというファイルについて。
-
Excellにて→ファイルエラー:デ...
-
mrl→midファイルへ
-
外字ファイル、eudc.tte と e...
-
.tmp.mp4と.mp4の違い
おすすめ情報