![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?8acaa2e)
No.1ベストアンサー
- 回答日時:
PDFからWordなどに直接変換するソフトは多分、フリーやシェアウェアでは無いと思われます。
また、OCRのソフトですが、PDFをそのままOCRするには、Adobe社のAcrobatを使用する方法か専用のOCRソフトを購入する必要があると思います。
専用のOCRソフトでは、『読んでココ』と言うソフトが比較的有名かと思います。
http://ai2you.com/ocr/
フリーで行いたいのでしたら次の方法が提案できます。
1.PDFをJPG画像に変換する。また文字の輪郭をはっきりさせる。PDFに書き戻す(ChainLP)
2.1で作成した文字輪郭をはっきりさせたJPG画像のOCRをかける(i2OCR:Webサービスです)
3.OCRの結果と1で書き戻したPDFを結合する(PrimoPDF)
それぞれソフト及びウェブサービスはサイトは以下にいあります。
ChainLP
http://no722.cocolog-nifty.com/blog/chainlp/
i2OCR
http://www.sciweavers.org/free-online-ocr
PrimoPDF
http://www.primopdf.com/index.aspx
しかし、i2OCRの文字認識率は非常に低いです。
もし、質問者様がにじんだ文字を少し読みやすくしたいと言うだけでしたらChainLPを使われるとにじみは少なくなると思います。
さらに、テキストとして認識される部分までを目的とするのでしたら期待される結果は得られにくいと思います。i2OCRの文字認識率が非常に低いためです。
上記のAcrobatや読んでココなどのOCRを持ちいれば、テキストとしては認識するようになりますが、文字のにじみは直らないと思います。また、これらのOCR専用ソフトであっても文字認識率は100%にはなりません。なぜなら、OCRそのものの機能が画像を解析して、解析結果近い文字をあてはめる作業を行うからです。解析アルゴリズムは各社様々ですが、画像->文字へ変換するための完璧なアルゴリズムは現状存在しません。にじんでいる画像PDFなら尚更認識率は下がる事と思います。
Acrobatも読んでココも体験版があると思いますので、実際使われてみると認識率がわかると思います。
OCRが完璧で無い以上、仮にWordなどを生成しても完璧なWordが出来ないと言う事です。
綺麗に読みたいか、テキストとして認識したいかのどちらかに分けられてソフトを選択されるといいかと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- PDF acrobatでwordファイルをpdfに変換すると文字化けする 3 2023/02/10 09:31
- PDF PDF作成ファイルの不具合の件 5 2022/08/15 15:00
- Excel(エクセル) フォルダ内のワードファイルをPDFに一括変換するVBA 3 2023/06/09 16:51
- その他(プログラミング・Web制作) python OpenPyXLを使って出力結果をエクセルに書き込み 2 2022/06/04 19:46
- PDF I LOVE PDF利用 pdfからWordに変換について 回答お願いいたします。 無料のI LOV 1 2022/05/13 13:24
- その他(Microsoft Office) Wordを変換してExcelに挿入 2 2022/07/04 23:59
- Word(ワード) テキストデータのPDFをWordで開くとテキストが図として認識されてしまう 3 2023/01/24 11:38
- Word(ワード) wordで画像&文書作成→pdf→pngに変換するにはどうすれば良いですか?有料ソフトを使いません。 3 2022/08/07 09:25
- PDF WindowsでPDFの書き込みができるソフトを探しています 2 2023/05/01 11:25
- Visual Basic(VBA) エクセルのマクロについて教えてください。 4 2023/07/03 09:11
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
PDFとは??
-
Win10での文字認識に関する質問
-
紙に書いてある文字をスキャン...
-
原稿用紙の内容をコピーしたい
-
PDF をワードやエクセルに変換...
-
OCRソフトについて
-
原稿を読み取って編集したい
-
スキャナで読み込んだ文書をワ...
-
違法コピーはどうやってバレる?
-
同じフォルダ内の画像を連続し...
-
PDFの切り取り
-
変更前のコンピュータ名を調べ...
-
Returned mail: see transcript...
-
WindowsXPでしか動かなかった...
-
Zipを右クリック→エクスプロー...
-
職場で使えないのに使わざるを...
-
VLC media playerで複数の音声...
-
のぎへんに「豊」と書いて何と...
-
画像から面積を求めるソフト
-
retas studio と clip studio...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
PDFとは??
-
Win10での文字認識に関する質問
-
原稿用紙の内容をコピーしたい
-
スキャンしたPDFをエクセルに変...
-
pngをtxtへ変換の仕方
-
Mac用のソフトで探していま...
-
PDFデーターをWord2013に落とし...
-
Scan Snap S1300
-
PDF をワードやエクセルに変換...
-
スキャンした書類に文字を入れ...
-
紙に書いてある文字をスキャン...
-
文章のスキャン(JPG)をエクセル...
-
ブラザー7460DNでスキャンし...
-
パワーポイントで作成されたPDF...
-
紙ベースの文章をワードにする
-
スキャナーで文字をパソコンに...
-
PDFファイルをWordかExcelに変...
-
テキスト取りだし
-
OCRソフトでPDF形式の表を読み...
-
昔のワープロ文書をワードに貼...
おすすめ情報