No.2ベストアンサー
- 回答日時:
OCRではなく、そのままテキストとしてコピーして、適当なテキストエディタでCSVにしてからエクセルなどで読取ります。
[例]
⇒履歴書・職務経歴書のサンプル( http://www.workport.co.jp/template/dl.html )
の卒業年早見表のPDFですと、最初の部分をテキストエディタにコピーすると
昭和
31
年
昭和
32
年
昭和
33
年
昭和
34
年
昭和
35
年
昭和
36
年
・・・【以下略】・・・
となりますから、
\n([H,\d]{1}\d)\n ⇒ \1,
と言う風に正規表現をつかってCSVに変更し細かい調整すると
,,生まれた年,,,,,,,,,
,,昭和31年,昭和32年,昭和33年,昭和34年,昭和35年,昭和36年,昭和37年,昭和38年,昭和39年,昭和40年
小学校,卒業3月,44,45,46,47,48,49,50,51,52,53
中学校,卒業3月,47,48,49,50,51,52,53,54,55,56
高等学校,入学4月,47,48,49,50,51,52,53,54,55,56
,卒業3月,50,51,52,53,54,55,56,57,58,59
大学,入学4月,50,51,52,53,54,55,56,57,58,59
,短卒3月,52,53,54,55,56,57,58,59,60,61
,卒業3月,54,55,56,57,58,59,60,61,62,63
になります。これを.csvとして保存して、エクセルで開く。開いてご覧なさい(^^)
★PDFは、あくまで印刷物です。
元々、UNIXなどのネットワーク上のプリンターで印刷するpostscriptプリンターというコンピューター内臓のプリンターがあり、各コンピューターはpostscriptというテキストデータをプリンターに送るだけで、印刷できてました。Windosのように一台ごとにドライバーをインストールしなくてすむ。このpostscriptを可視化したものがPDFですので・・
No.3
- 回答日時:
> 1、OCRソフトで表を読み込むのは難しいのですか?
単純な表は問題ありませんが、複雑な表や細い罫線の表では困難です。
OCRソフトは、スキャナで読み取った図形を解析し、文字として認識して出力するためのソフトなので、スキャニングの条件(濃淡)によっても差異が発生します。
むしろ、原稿の表の罫線の位置をスケールで読み取り、「表のプロパティ」で「行の高さ」「列の幅」などを指定した方が簡単に短時間で再現できます。
> 2、OCRソフト以外に表を読み取る方法はありますか?あったら教えてください。
残念ながら知りません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- PDF Adobe Acrobat DCでは複数のPDFをOCR化できますか? 2 2022/04/19 15:25
- 政治 私の発明した「二階建て漢字」は使えるでしょうか? 3 2023/02/08 16:40
- フリーソフト Windowsの特殊文字を削除や変換したい そんなフリーソフトはありますか? 3 2022/11/09 00:05
- その他(プログラミング・Web制作) 【python】Excelファイルを読み込む際の日付の表示形式を任意にする 2 2022/11/24 14:21
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- Excel(エクセル) 差し込み印刷がうまくいかない 2 2022/07/29 12:26
- プリンタ・スキャナー scansnap 1 2022/12/31 11:38
- PDF acrobatでwordファイルをpdfに変換すると文字化けする 3 2023/02/10 09:31
- システム 外付けHDDの初期化について 4 2023/03/05 20:00
- システム 外付けHDDの初期化について 4 2023/03/05 21:19
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
PDFとは??
-
Win10での文字認識に関する質問
-
PDF をワードやエクセルに変換...
-
hotmail.comと@hotmail.co.jp
-
PDFの切り取り
-
WindowsXPでしか動かなかった...
-
@live.jpと@hotmail.co.jpの違いは
-
質問は2つです。 Sma4winという...
-
ドキュワークスのようなソフト...
-
NET Broadcast Event Window
-
体験版試用期限のリセットをしたい
-
変更前のコンピュータ名を調べ...
-
スタートアップにSBSVというの...
-
違法コピーはどうやってバレる?
-
Zipを右クリック→エクスプロー...
-
同じフォルダ内の画像を連続し...
-
2ページのワード文書を1ページ...
-
イラレのデータを名刺にしたい...
-
他人が私のパソコンを覗くこと...
-
画像の上の文字を消したい
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
PDFとは??
-
Win10での文字認識に関する質問
-
原稿用紙の内容をコピーしたい
-
スキャンしたPDFをエクセルに変...
-
スキャンした書類に文字を入れ...
-
PDFデーターをWord2013に落とし...
-
OCR
-
PDF をワードやエクセルに変換...
-
OCRソフトでPDF形式の表を読み...
-
pngをtxtへ変換の仕方
-
紙ベースの文章をワードにする
-
OCR
-
ブラザー7460DNでスキャンし...
-
PDFの切り取り
-
違法コピーはどうやってバレる?
-
WindowsXPでしか動かなかった...
-
hotmail.comと@hotmail.co.jp
-
NET Broadcast Event Window
-
のぎへんに「豊」と書いて何と...
-
フォートナイト エラー
おすすめ情報