No.2ベストアンサー
- 回答日時:
OCRではなく、そのままテキストとしてコピーして、適当なテキストエディタでCSVにしてからエクセルなどで読取ります。
[例]
⇒履歴書・職務経歴書のサンプル( http://www.workport.co.jp/template/dl.html )
の卒業年早見表のPDFですと、最初の部分をテキストエディタにコピーすると
昭和
31
年
昭和
32
年
昭和
33
年
昭和
34
年
昭和
35
年
昭和
36
年
・・・【以下略】・・・
となりますから、
\n([H,\d]{1}\d)\n ⇒ \1,
と言う風に正規表現をつかってCSVに変更し細かい調整すると
,,生まれた年,,,,,,,,,
,,昭和31年,昭和32年,昭和33年,昭和34年,昭和35年,昭和36年,昭和37年,昭和38年,昭和39年,昭和40年
小学校,卒業3月,44,45,46,47,48,49,50,51,52,53
中学校,卒業3月,47,48,49,50,51,52,53,54,55,56
高等学校,入学4月,47,48,49,50,51,52,53,54,55,56
,卒業3月,50,51,52,53,54,55,56,57,58,59
大学,入学4月,50,51,52,53,54,55,56,57,58,59
,短卒3月,52,53,54,55,56,57,58,59,60,61
,卒業3月,54,55,56,57,58,59,60,61,62,63
になります。これを.csvとして保存して、エクセルで開く。開いてご覧なさい(^^)
★PDFは、あくまで印刷物です。
元々、UNIXなどのネットワーク上のプリンターで印刷するpostscriptプリンターというコンピューター内臓のプリンターがあり、各コンピューターはpostscriptというテキストデータをプリンターに送るだけで、印刷できてました。Windosのように一台ごとにドライバーをインストールしなくてすむ。このpostscriptを可視化したものがPDFですので・・
No.3
- 回答日時:
> 1、OCRソフトで表を読み込むのは難しいのですか?
単純な表は問題ありませんが、複雑な表や細い罫線の表では困難です。
OCRソフトは、スキャナで読み取った図形を解析し、文字として認識して出力するためのソフトなので、スキャニングの条件(濃淡)によっても差異が発生します。
むしろ、原稿の表の罫線の位置をスケールで読み取り、「表のプロパティ」で「行の高さ」「列の幅」などを指定した方が簡単に短時間で再現できます。
> 2、OCRソフト以外に表を読み取る方法はありますか?あったら教えてください。
残念ながら知りません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Win10での文字認識に関する質問
-
PDFとは??
-
紙に書いてある文字をスキャン...
-
Scan Snap S1300
-
Mac用のソフトで探していま...
-
Wave Pad のソフトを使っていま...
-
PDFの切り取り
-
のぎへんに「豊」と書いて何と...
-
NET Broadcast Event Window
-
変更前のコンピュータ名を調べ...
-
WindowsXPでしか動かなかった...
-
hotmail.comと@hotmail.co.jp
-
2ページのワード文書を1ページ...
-
画像の上の文字を消したい
-
質問は2つです。 Sma4winという...
-
Zipを右クリック→エクスプロー...
-
パソコンが操作不能です
-
再起動で初期状態に戻る、ネッ...
-
@live.jpと@hotmail.co.jpの違いは
-
違法コピーはどうやってバレる?
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
PDFとは??
-
Win10での文字認識に関する質問
-
pngをtxtへ変換の仕方
-
原稿用紙の内容をコピーしたい
-
スキャンしたPDFをエクセルに変...
-
PDF をワードやエクセルに変換...
-
スキャナで読み込んだ文書をワ...
-
透明テキスト付きPDFファイルを...
-
PDFを編集できるフリーソフトは...
-
原稿を読み取って編集したい
-
ブラザー7460DNでスキャンし...
-
紙に書いてある文字をスキャン...
-
PDFデーターをWord2013に落とし...
-
OCRソフトについて
-
紙ベースの文章をワードにする
-
文章のスキャン(JPG)をエクセル...
-
Scan Snap S1300
-
テキスト取りだし
-
WindowsXPでしか動かなかった...
-
PDFの切り取り
おすすめ情報