![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?8acaa2e)
自動車修理の技術資料ですが、長期に渡って蓄えた資料が5cmのファイルに10冊あります。
これらは、発生順に綴じられていて、症状や、車種で検索する事ができません。
自分なりに考えた案は、
●OCRソフトなどで読み込んで、文字列による検索を可能に... (検索精度、早さを向上)
●OCRの誤変換の対策として、スキャンデータも残してそちらも読めるようにしたい
※資料の半分以上は、FAXなので あまり綺麗ではありません
教えて頂きたい点は
1. どんなソフトが最適か?
2. 全ての資料を対象に、検索できる保存方法 (例 全てを1冊としてまとめる...など)
3. まったく違うやり方で、もっと良い方法
どうぞ、よろしくお願いします。
![「技術資料の自炊 (PDF化)」の質問画像](http://oshiete.xgoo.jp/_/bucket/oshietegoo/images/media/e/1755692_5497cd4f9a5b6/M.jpg)
![](http://oshiete.xgoo.jp/images/v2/common/profile/M/noimageicon_setting_15.png?8acaa2e)
No.2ベストアンサー
- 回答日時:
珍答も出ていますが、まず私がやっている方法を紹介します。
私はソースネクストの「いきなりPDF」を使っています。
http://www.sourcenext.com/product/pc/ikp/pc_ikp_ …
このソフトは値段が安いことからもわかるように、お手軽に資料をPDF化するソフトで、画像(文字や図)の上にOCRで読み取った文字が乗りますが、編集機能がないので誤変換はそのまま、ただしADFと併用すると作業は速いです。
スキャナーはA3のADF付の中古を購入しました。
スキャナーで画像保存して下記を使うこともあります。
http://www.sourcenext.com/product/pc/ikp/pc_ikp_ …
OCRにこだわるなら、他社の体験版をテストして変換精度のよいものを選択し、PDFにするとよいでしょう。
スキャナーは連続取り込みができるものが楽です、ドキュメントスキャナーかADF付フラッドヘッドか迷いましたが、私はADFにしました。
なお、個人が自分用に書籍や資料をスクラップして利用することは著作権法で認められており、勝手に個人が行う分には何ら問題ないです。
逆に会社が内部資料とするには著作権問題が出てきます。
紹介していただいた、いきなりPDF for 自炊を見させていただきました。機能や価格面でかなり理想に近いものだと思います。
透明テキストの存在を知らなかったので、紹介されるまでこんな方法は考えもつきませんでした。
問題は変換精度ですね。
とても的確なアドバイスを頂きありがとうございます。
![](http://oshiete.xgoo.jp/images/v2/common/profile/M/noimageicon_setting_15.png?8acaa2e)
No.4
- 回答日時:
ちなみに
http://www.dennobaio.jp/shopbrand/035/010/Y
上記ショップで大量スキャン用のスキャナーが格安で売っており、かなり迷いましたがA3が欲しかったのでパスしました。
もともと業務用なのでかなり速いと予想しますが、中古だけに程度に関しては買ってみないと何とも言えません。
複合機にオートフィーダーが付いているので、まずは それでスタートしてみます。かなり古い資料もあるので、紙詰まりなども心配ですが...
著作権などについては、外部へ出なければ問題ないようです
No.3
- 回答日時:
>1. どんなソフトが最適か?
これはNo2の方が書かれている通り、OCRの体験版を試してみるのが一番です。
OCRはどうしても認識ミスを避けられないので、実際に試してみて認識率を試してみるべきでしょう。
(特に図表の多い添付の画像では、どういうファイルが出来上がるかも確認するためにも一度試してみるべきです。)
添付の画像から、文字は印字されたもののようで、手書きではないようですから、OCRにはかけやすいと思います。
>2. 全ての資料を対象に、検索できる保存方法 (例 全てを1冊としてまとめる...など)
すべてを1ファイルにまとめられれば簡単ですが、ファイル容量的にどうなることやら…。
(不可能とは言いませんけど相当な容量になるのは間違いないでしょう。)
(ちなみに今自分の手元にある130ページほどの論文のPDFファイルで3.45MBくらい。)
(ただグラフ部分もありますが文章部分が圧倒的に多いため、添付の画像では図示が多いため容量が大きくなるんじゃないかと思います。)
適当な区切り(たとえば発行年度ごとなど)をつけてファイルを分けるのが現実的でしょう。
肝心の検索方法としては、複数のPDFファイルに対して横断的に検索するAdobe Readerの機能を利用できればコスト的にも労力的にも安上がりでしょう。
http://helpx.adobe.com/jp/acrobat/kb/3320.html
文書スキャナについては専用の連続スキャナか、もしくはオフィスにある複合機が新しければそれについているスキャナ機能を利用する方法があるでしょう。
枚数が多いので、オートフィーダは必須です。(1枚1枚やっていたら途方に暮れてしまいますからね。)
専用連続スキャナは買うと高いですが、自炊支援業者で貸し出してくれるところもあるらしいので、それを利用するのも手です。
>3. まったく違うやり方で、もっと良い方法
身もふたもない話ですけど、スキャン作業に関してはルーチンワークになるので、専門業者に投げてしまうのも手です。
専門業者なので十分な設備をもっているはずですから、ある程度まとまった量があり、経費に折り合いがつくならば、こちらの方が手間暇がかからないという点で楽です。
例→http://campaign.otsuka-shokai.co.jp/scan-lp/
ただ、技術文書はおそらくこれから先も出てくるものですから、それらのことを考えて自分たちの手で処理方法を確立しておくことは重要です。
そのため前述したことを検討しておくのは意味あることだと思います。
専門業者はまとまった量を頼まないとと総じて価格が割高になりがちですからね。
以上、思いついたことを書きましたが、参考まで。
読取革命とアクロバットを使用しました。この二つなら読取革命の方が、うちの文章との相性が良さそうです。
いきなりPDF...は、使用できませんが安価なので購入する予定です。
複数のPDFを対象に検索する機能は嬉しいですね。おっしゃる通り一つのファイルにしてしまうと、開くまでにとても長い時間がかかりそうです。
貴重なアドバイスを頂きありがとうございました。
No.1
- 回答日時:
ご質問の主旨とは外れます。
とても良い考えだと思いますが、その作業は個人的に行おうとしているのでしょうか。
それとも会社として取り組むのでしょうか。
まずそこのところが問題です。
通常、そのような技術資料は、勝手に個人で何かをするということは認められていないはずだからです。
もし自炊をしたいのであれば、会社にお伺いを立てなければなりません。
勝手にやれば機密漏洩に問われる場合があるからです。
そのあたりはクリアになっているでしょうか。
自炊の効率的な方法は他の回答者さんが示してくださると思います。
ちょっと気になりました。
クリアになっているのであればスルーしてください。
スイマセン。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(パソコン・スマホ・電化製品) 半導体メーカー売り上げランキングと、 ファウンダリを含んだ売り上げランキング、 これらの過去10年く 2 2023/02/25 16:16
- 法学 商法580条の学術的資料文献を引用しなければならないのですが、学術的資料を検索する方法って何がありま 1 2023/07/25 20:42
- その他(職業・資格) 【資格】あらゆる資格(国家資格・民間資格)の強さの格付けランキングを作ってみました! 4 2023/02/11 16:56
- Visual Basic(VBA) エクセルのマクロについて教えてください。 2 2023/07/10 09:06
- 電車・路線・地下鉄 「JR東日本会社要覧2019-2020」について。何の資料ですか? 最新版や過去の版はありますか? 2 2022/07/04 10:59
- iPhone(アイフォーン) 仕事でPDFファイルをダウンロード、閲覧するのにiBooksを使っていますが、ライブラリに凄い数のフ 2 2022/11/16 07:08
- PowerPoint(パワーポイント) PowerPointでプログラミングの資料を綺麗に作る方法 2 2022/12/03 05:45
- 大学・短大 大学生です。自己剽窃について質問です。 同じ先生の授業を前期と後期にわたって受講しているのですが、前 1 2023/01/31 22:56
- その他(教育・科学・学問) 大学教員採用選考について 3 2022/10/01 15:40
- その他(プログラミング・Web制作) LINEアプリの開発について。オブジェクトの名前が教えてください 1 2023/02/23 09:31
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
TIFFをエクセルへ
-
コンボボックスの文字を大きく...
-
「マネージメント」と「マネジ...
-
小さな会社の事務全般の社員。...
-
先月退職した会社へ,書類記入...
-
現金引換え書類渡しって?(CAD)
-
ビジネスメールの添削をお願い...
-
エクセルでURL挿入後、名前を変...
-
取引相手の名刺をなくしてしま...
-
会社情報に主要取引銀行を書く...
-
A4シール紙を手差し印刷できる...
-
複写用紙の後の方が薄い場合直...
-
営業目的の人に名刺を求められ...
-
名刺の取次ぎ
-
銀行就職とクレジットカードの滞納
-
英語の名刺で、長い部署名の表...
-
飛び込み営業に来る人との名刺...
-
会社員が博士になったら、会社...
-
エクセル関数使用で赤色数字を...
-
新入社員っていつ名刺をもらえ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
TIFFをエクセルへ
-
ドキュワークスってどうですか?
-
コンボボックスの文字を大きく...
-
スキャンしたデータに書き込み...
-
バーコード読み取りで写真を表...
-
技術資料の自炊 (PDF化)
-
いきなりPDF to DATAについて
-
ワードで作った文章をHPにアッ...
-
aiデータ数枚を一つのPDFにする...
-
PDFのテキストのコピーが「...
-
Easy CD Creatorで複数のCDをつ...
-
Ulead DVD movie writerでのDVD...
-
Macのインデザインで作ったデー...
-
MACからWINDOWSへの宛名職人の...
-
パーソナル編集長のデータをワ...
-
筆王2002年版で
-
PDFファイルの英文・和訳を...
-
音楽ファイルMP3の整理法
-
図と写真と文章の入った小冊子...
-
ベリファイについて
おすすめ情報