
すみません。
どなたか、回答よろしくお願いします。
印刷されたドキュメントをスキャンして、PDFファイルで保存した後、スキャンソフトにOCR化の機能が付いていたので、OCR化すると、ファイルサイズがかなり小さくなりました。
これはなぜでしょうか。
最初は、画像データが文字コードに置き換えられたからだと思っていたのですが(OCRの原理を調べてもそのようなことが書いてあったので。)、そのファイルの文字をみても、文字の形(フォント等、かすれ具合等)はどうみてもOCR化される前の画像データ?と変わりません。
そうすると、OCR化したファイルは、文字の画像データとこれに対応する文字コードデータを持たなければならなくなり、かえってデータ量が増えるような気がします。
でも、現実には減少しているので、いったいどのような仕組みになっているのでしょうか。
そもそもPDFファイルの仕組み(まったくの画像データではないようですね。)や、OCRの理解が不十分なので、よけい分からないのですが、初心者にも分かるようにご説明いただけたら有り難いです。
よろしくお願いします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
パワーポイントからイラストレ...
-
JWWでの画像同梱 ファイルが開...
-
ワードのデータをIllustratorに...
-
tiffファイルがくすんで見える...
-
AutoCAD2009LTで塗り潰しハッチ...
-
PDFのOCR化でファイルサ...
-
イラストレータのデータをPDFで...
-
AutoCADで作成した図面を印刷す...
-
B4のワードデータをA4サイズのP...
-
JWWで文字をカラー印刷するのは...
-
レーザープリンターの解像度
-
ビューポートと印刷範囲がずれる
-
AutoCADにはり付けた画像が印刷...
-
4色使用のイラストレーターのデ...
-
WordにExcelデータを差し込みラ...
-
Indesignで書き出したPDFが重い...
-
新聞記事のQ数、Pt、フォント(...
-
WordでA3の2倍分に印刷する方法
-
ベクターワークスで透明プリント
-
jwcadで印刷時の画面の色を白か...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
パワーポイントからイラストレ...
-
JWWでの画像同梱 ファイルが開...
-
ワードのデータをIllustratorに...
-
tiffファイルがくすんで見える...
-
DynaCADに挿入した画像が表示さ...
-
AutoCAD2009LTで塗り潰しハッチ...
-
BlueTrendにラスターデータとし...
-
AutoCADでOLEオブジェクトの挿...
-
Quark XPressの基本なのですが...
-
Indesignのドロップシャドウ効...
-
AutoCAD2002にJPEG画像データを...
-
PDFのOCR化でファイルサ...
-
イラストレータのデータをPDFで...
-
画像を等間隔に並べたい
-
ロウソク足・グラフ作成ソフト...
-
photoshop画像のIllustrator配...
-
CADにデータを貼り付ける方法で...
-
Quarkでの画像取り込みができま...
-
PDFを軽くしたい(急いでます)
-
Adobe Illustrator cs リンクパ...
おすすめ情報