今だけ人気マンガ100円レンタル特集♪

よろしくお願い致します。

PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか?
卒業文集の文章を、ブラザーの複合機でスキャンしpdfにしました。
それを変換ソフトを使って(変換中ocrと表示されます)ワードやエクセルにすると
文字化けしてしまいます。

どうにか文字化けしないようにするにはどうしたら良いでしょうか?
ご教授下さいませ。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

>PDF をワードやエクセルに変換すると文字化けするのは何故でしょうか?



何故でしょうって、そりゃOCRの宿命だから。

紙に印刷された白黒のパターンをもとに、何千字という辞書から正しいと考えられる文字を探すんですよ。
一文字も間違わない方が、むしろ不思議です。


もともとbrotherの添付ソフトであるプレストのOCRは認識率が低いです。


とりあえず、そんなに小さな字でなければ解像度を300-400dpiで固定し
原稿濃度を濃くしたり薄くしてスキャンして、一番認識率が高い(誤認識:文字化けの少ない)
コンディションを探してください。

きれいな原稿を用意するのも、認識率を高める一つの手です。
    • good
    • 0
この回答へのお礼

ご教授ありがとうございました。
OCRとはそのようになっているんですね・・・
勉強になりました。

本当にありがとうございました。

お礼日時:2012/09/06 09:22

それは「文字化け」とはいいません、「誤認識」といいます。


つまりパソコンが読み違えているだけ・・・
    
OCRソフトの宿命です。
対策は・・・
読み込んだ画像の明暗、濃度などの調整、OCRソフトの読み取り精度などで、多少は良くなるかも?
    • good
    • 1

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QPDFから文字化けしないテキスト変換方法は?

スキャンスナップで自炊したPDFファイルをOCR処理や文字をメモ帳にコピペしテキストファイル化すると、どうしても文字化けしてしまいます。保存の形式も色々と試しましたが中国語みたいな漢字に変換や文字抜けが発生します。文字化けしない良い方法はありますか?ご教示よろしくお願いいたします。

Aベストアンサー

自炊だとテキスト情報はOCRで生成するわけですが、OCRの認識率が100%じゃない以上は文字化けなどはどうしても発生してしまいます。いまどきのOCRなら99%かそれ以上の認識率はあるでしょうけど、99%だって100文字読んだら1文字は間違える計算になり、まとまった量の文字を読ませれば結構な誤読が発生してしまうことに。

テキストをコピペする方法にかかわらず、元になるテキストに誤読があるわけだから、いかなる方法でコピペしようと文字化けは回避不可能です。気が付いた時点で「必殺・全手動修正」を発動させるしかありません。

出来上がりのファイルサイズを小さくするために、取り込みの時の解像度を下げすぎると誤読が増えやすいので、ここはあまりケチらない方が良いかとは思います。面倒だけど、見た目や認識率、ファイルサイズのバランスを取れる設定を試行錯誤する必要があるでしょう。

QPDFからワード・エクセルに変換すると文字化けする

ソースネクストのPDFからワードエクセルに変換するソフトを
使用しましたが、文字化けして困っています。

Aベストアンサー

#2で回答したmuchoです。今回の問題、まだお困りでしょうか?参考までに私の体験談を。(すごくいいソフトを今日発見、購入しました!)

ExcelのPDFからExcelファイルにどうしても戻したい物があり、最近までずっと悩んでおりました。WordだったらAcrobatでやればいいと思っていたのですが、Excelは最新のAcrobat8でも変換できないので困り果てていました。2年前に買った「いきなりPDF to DATA」だとろくな変換が出来ないので何とかまともに変換できるソフトが無いものかと探していました。

(高品質のPDF変換ソフト)
とうとう見つけました!ジャングルという会社の「編集!PDF」(ダウンロード版だと5700円)これは優れものです。いきなりPDFtoDATAの場合は変換するとデータがテキストボックスに入ってしまい、いちいちコピー、ペーストをしなければならず大変面倒でした。(それ以前に誤変換が多く使い物にならないという問題がありますたが・・・)

「編集!PDF」は体験版(下記URL)もあるので是非一度使ってみて、満足いくようであれば購入してはどうでしょうか?私はいくつかのPDFファイルをWord,Excelに変換してみましたが実用に耐えうる非常によいソフトと判断し、ダンロード版を購入しました。私が思っていた以上によかったので、27099様にも是非お知らせしようと思い、再度回答させていただきました。(私はこの会社の回し者ではないです。念のため)

参考URL:http://www.junglejapan.com/products/biz/apdf/hpdf/trial.php

#2で回答したmuchoです。今回の問題、まだお困りでしょうか?参考までに私の体験談を。(すごくいいソフトを今日発見、購入しました!)

ExcelのPDFからExcelファイルにどうしても戻したい物があり、最近までずっと悩んでおりました。WordだったらAcrobatでやればいいと思っていたのですが、Excelは最新のAcrobat8でも変換できないので困り果てていました。2年前に買った「いきなりPDF to DATA」だとろくな変換が出来ないので何とかまともに変換できるソフトが無いものかと探していました。

(高品質のPDF...続きを読む

QPDFファイルの文章をコピーしてワード文書に貼り付けようとしたら文字化けします。

PDFファイルの文章をコピーしてワード文書に貼り付けようとしたら文字化けします。
改善方法を知っている方教えて下さい。

Aベストアンサー

Wordで、「編集」→「形式を選択して張り付け」→「テキスト」のラジオボタンをオンにして「OK」を押してみてください。

QPDF⇒Word,Excel変換について

Word,Excel⇒PDFへの変換ソフトは沢山あるのですが、
表題通り PDFファイル⇒Word,Excelに変換できるフリーソフトウェアはありますでしょうか?

Aベストアンサー

>私が聞いているのは
表題通り PDFファイル⇒Word,Excelに変換できるフリーソフトウェアです。

NO1さんの言ってる意味を理解してますか?
NO1さんの言うとおりできますよ。
できなければNO2さんの言うとうりで、できないのはあなたの持っているPDFのファイルがテキストに変換できない種類(画像など)なだけです。
よく理解して少し使い方を勉強してください。

結論から言えばフリーソフトがなくても変換は可能です。

QPDFのテキストのコピーが「・・・」に化けてしまいます

PDFファイルで「テキスト選択」はできるのですが、
EXCELでもテキストファイルでも、貼り付けると、
すべて「・・・・」としか表示されません。

どうも、文字数はあっているようなのですが、
文字としてコピーできていません。

バージョンは、Adobe Reader 6.0 で、
OSは、ウィンドウズ98SEです。

文字ではなく、アウトライン=絵として保存されているの
なら諦めますが、何が何だかわからなくて、非常に困って
います。
どなたかアドバイスをお願い致します。

Aベストアンサー

Adobe Readerの「ファイル」→「テキストとして保存」を実行し
ても、文字化けしているテキストしか作成されないでしょうか?
おそらくPDF作成時の問題(プリンタドライバの設定やPDF作成
の方法)だと思いますので、再度作成し直さないとコピーした
テキストを使用できるようにはならないのではと思います。
東京都のPDFファイルというのは、一般公開されているもの
でしょうか?
一般公開されているのでしたら、そのページのアドレスと
ファイル名を教えていただければ、私も自分で確認してみ
たいのですが...(^^;

http://support.adobe.co.jp/faq/faq/qadoc.sv?219039+002
※古い情報になりますが、このページでType1フォント
は検索に確実性があるフォントと説明されています。
(PDF文書内を検索できる場合は、コピーしたテキストも
きちんと認識されて文字化けしないようです。)
※Type1フォントのPDFファイルでも検索できないものが
作成されましたので、アプリケーションや設定によって
異なる場合もあるようです。

Distillerで作成したPDFの場合は、設定や手順が正しけ
ればきちんと検索・コピーしたテキストを再利用できる
ファイルになるはずですので、もし再変換をお願いでき
る場合は、相手の方に再度PDF作成を依頼してみては
いかがでしょうか?


以下のページは、Acrobat DistillerでPDFを作成する
場合の各種設定方法です。

・変換元のアプリケーションからAcrobat Distiller
プリンタに印刷し、直接PDFファイルを作成する場合
http://support.adobe.co.jp/faq/qadoc/AJ25.nsf/10078dba5304a487492569690008402a/fa6504813e4f87b149256d05002578ee?OpenDocument

http://support.adobe.co.jp/faq/qadoc/AJ25.nsf/041584e8dbf36c09492569690008402c/6c802d35efee64f949256aa10025f979?OpenDocument

http://support.adobe.co.jp/faq/qadoc/AJ25.nsf/10078dba5304a487492569690008402a/596dc745a7eab02949256b3900259188?OpenDocument

・変換元のアプリケーションからAcrobat DistillerプリンタでいったんPostScriptファイルに書き出す場合
http://support.adobe.co.jp/faq/qadoc/AJ25.nsf/041584e8dbf36c09492569690008402c/5dc572c40f8ec43549256c230027ed2c?OpenDocument

http://support.adobe.co.jp/faq/qadoc/AJ25.nsf/10078dba5304a487492569690008402a/349e6a2937bb924349256b9c002975c4?OpenDocument

Distillerの場合は、特別なことをしなければたぶん
コピーしたテキストを再利用できるPDFが作成される
と思いますが、可能な限りいろいろな方法で試しても
らうと良いです。
仕事相手などではなくて、一般公開されているデータ
ファイルの場合は無理だと思いますので、残念ですが
諦めるしかないと思います。
ダウンロードページを公開できるのでしたら、私も試
してみたいのでよろしくお願いします。m(__)m


※No.1でWin98SEでPrimoPDFを使用して作成した場合
は、コピーしたテキストが文字化けすると書きましたが
設定で回避できるかもしれません。
(コントロールパネルからPrimoPDFのプリンタドライバの
設定を開いて、「fonts」タブの左下にあるボタン(表示さ
れている項目名は見えないので?)を押して、TrueType
フォントの送信方法を「Outlines」から「Type42」に変更し
ます。)
※ただし、私の環境ではこの設定変更をするとPrimoPDF
が起動せずにフリーズしますので確認できていません。

今回のご質問とは関係ないようですが、回答に間違いが
あったかもしれませんので、ここで補足します。

Adobe Readerの「ファイル」→「テキストとして保存」を実行し
ても、文字化けしているテキストしか作成されないでしょうか?
おそらくPDF作成時の問題(プリンタドライバの設定やPDF作成
の方法)だと思いますので、再度作成し直さないとコピーした
テキストを使用できるようにはならないのではと思います。
東京都のPDFファイルというのは、一般公開されているもの
でしょうか?
一般公開されているのでしたら、そのページのアドレスと
ファイル名を教えていただければ、私も自分で確認してみ
たいのです...続きを読む

QWordで、1ページを丸ごと削除するには?

1ページしか必要ないのに、真っ白な2ページ目がその下に表示されてしまった場合、この余分な2ページ目を一括削除(消去)する為に、何かいい方法があるでしょうか?

Aベストアンサー

<表示されてしまった場合>
これはそれなりに理由があるわけで、改ページや改行によって、次のページにまで入力が及んでいる時にそうなります。
特に罫線で表を作成し、ページの下一杯まで罫線を引いたときなどには、よくなる現象です。

さて、メニューの「表示」で段落記号にチェックが入っていないと、改行や改ページなどの入力情報が見えず、白紙のページを全て選択→削除してもそのままということが良くあります。
1 改行マークが白紙のページの先頭に入っていれば、それをBackSpaceで消してやる。
2 罫線を使っている場合は、それでも効果がない場合がありますが、その時は行数を増やしてやる。
などの方法があります。

QWord 文字を打つと直後の文字が消えていく

いつもお世話になっています。
Word2000を使っているものです。
ある文書を修正しているのですが,文章中に字を打ち込むと後ろの字が消えてしまいます。
分かりにくいですが,
「これを修正します。」
という文章の「これを」と「修正します。」の間に「これから」という単語を入れたときに,その場所にカーソルを合わせて「これから」と打つと,
「これをこれからす。」
となってしまいます。
他の文書では平気です。
何か解決する方法があれば教えて下さい。

Aベストアンサー

入力モードが「挿入」(普通の入力)から、「上書き」になってしまっているのだと思われます。
キーボードに[Insert]というキーがあると思いますので、1度押してみてください。

Qエクセルで、条件に一致した行を別のセルに抜き出す方法

エクセルで、指定した条件に一致するセルを含む行をすべて抜き出す方法が知りたいです。

たとえば、

<A列> <B列> <C列>
7/1 りんご 100円
7/2 ぶどう 200円
7/2 すいか 300円
7/3 みかん 100円

このような表があって、100円を含む行をそのままの形で、
別のセル(同じシート内)に抜き出したいのですが。

7/1 りんご 100円
7/3 みかん 100円

抽出するだけならオートフィルターでもできますが、
抽出結果を自動的に、別の場所に、常に表示させておきたいのです。

初歩的な質問だと思いますが、検索しても分からなかったので、よろしくお願いします。

Aベストアンサー

同じ質問が結構よく出てますが、そんなに初歩的でもありません
別シートのA1セルに「100円」と入力し、そのシートの任意のセルに以下の式を貼り付けて下さい。後は、下方向、右方向にコピー。
日付のセル書式は「日付」形式に再設定してください

=IF(COUNTIF(Sheet1!$C:$C,$A$1)>=ROW(A1),INDEX(Sheet1!A:A,LARGE(INDEX((Sheet1!$C$1:$C$500=$A$1)*ROW(Sheet1!$C$1:$C$500),),COUNTIF(Sheet1!$C:$C,$A$1)-ROW(A1)+1)),"")

データ範囲は500行までとしていますが、必要に応じて変更して下さい

QWeb上でpdfファイルを開くと文字化けする

Adobe Reader 7.0.9を使っています。

先日、Web上のpdfファイルを開こうとしたところ、普通に開けるものと開けないものがありました。
(同じページにあるpdfファイルで、サイズなどもそれほど違いがありませんでした)
開けないほうのpdfファイルをクリックすると、下記のメッセージが出てきて、開かれたファイルは文字化けしていました。
(※普通に開けるファイルは、文字化けしていません)

【メッセージ】
The 'Updater' plug-in has been removed, please re-install Acrobat to continue viewing the current file.
(プラグ・インの「アップデータ」が削除されたので現在のファイルを見続けるためにはアクロバットを再インストールしてください)

そこで、Adobe Reader 7.0.9を一旦削除して、再インストールしましたところ、上記のメッセージは消えましたが文字化けは直りません。

文字化けしたPDFを、一旦ローカルにダウンロードして、ダブルクリックで開いたり、Adobe Reader 7.0.9を立ち上げて開いても、やはり文字化けしています。

ちなみに、Adobe Acrobat 8 Standardが入っているのですが、こちらを立ち上げて、文字化けしたpdfファイルを開くと、文字化けは直っていました。
Adobe Acrobat 8 Standardで開いた以降は、そのローカルのpdfファイルは、ダブルクリックで開いても文字化けしません。

ローカルで見る分には、面倒くさいのですが、Adobe Acrobat 8 Standardをたちあげれば
何とかpdfファイルを見れるのですが、Web上で開いた際に文字化けしてしまうのでとても困っております。

どなたかこれを改善する方法をご存知の方はいらっしゃいませんでしょうか。

WindowsXP Home Editionを使っております。

Adobe Reader 7.0.9を使っています。

先日、Web上のpdfファイルを開こうとしたところ、普通に開けるものと開けないものがありました。
(同じページにあるpdfファイルで、サイズなどもそれほど違いがありませんでした)
開けないほうのpdfファイルをクリックすると、下記のメッセージが出てきて、開かれたファイルは文字化けしていました。
(※普通に開けるファイルは、文字化けしていません)

【メッセージ】
The 'Updater' plug-in has been removed, please re-install Acrobat to continue viewi...続きを読む

Aベストアンサー

メニューバー→編集→環境設定→インターネット→PDFをブラウザに表示のチェックが入っていたら、外してみてください。

Qエクセルに写真の貼り付けが出来ません。

画像をコピーし、エクセルに貼り付けることが出来ません。(エクセル画面にすると貼り付けを選択することが出来ない状態)ワードでは同じ作業で貼り付けれるのですが、何かの設定がおかしいのでしょうか?
あと、ワードやエクセルに写真をコピーした時、画像が大きくてはみ出してしまうのですが、その大きさを前もって調製することはできるのでしょうか?
その方法を教えてください。宜しくお願いします。

Aベストアンサー

エクセルのバージョンがわかりませんがエクセル2007の場合、エクセルを起動して「挿入」>「図」>入れたい画像を選ぶ
で入れられました。

「コピー」ではなく、いったん画像をデスクトップやよく使うフォルダへ保存してから挿入してみてはどうでしょうか?

画像の大きさの変更ですが、エクセルに入れ前に大きさを変えたいということですので、フリーソフトなどでペイントソフトなどを探して、それで画像を加工してから上書き保存や別の名前を付けて保存して、それを挿入してみてはいかがでしょう?

http://www7.ocn.ne.jp/~otoku/free-s-gazousakusei.htm
ここに色々ソフトがあります。
ただ、新らしいソフトを使うということで、そのソフトの使い方になれる必要はあると思います。


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング