ギリギリ行けるお一人様のライン

お世話になります。

繁体字で出版された本の内容を簡体字に変換したいのですが、
どうすれば一番ラクにできるでしょうか?

本をスキャナで取り込み、PDFファイルを、何らかのツールで簡体字にできれば・・・と思いますが、
どうすれば良いのかわかりません。

ご存じの方、よろしくお願いします。

A 回答 (3件)

ANo.2つづきです.


ご紹介した「尚书七号ocr」 の件、installを試みましたが不具合でした。Windowsのエラーにかかります、未対応の所為と思われます。
私のPCは、Win7-64bitなのですが、「尚书七号ocr」の中国のサイトに64bitで可のような記事もあるので、そちらからダウンロードしてみましたが上記の状況です。無料版の所為かもしれません。暇を見て32bit機でやってみようと思います。

■なお、参考のため追加します。
「尚书七号ocr」のダウンロード は前回紹介したサイトにはYahoo.cnから探せと書いてありますが、中国語で沢山あるので取り敢えず以下を。
「尚书七号ocr」登録不要ダウンロードサイト、
  http://www.99d.com/down/72/48886.html
   as of 2010-09-28  評判
ダウンロード数:8355 大変良い:86%
    個別寄稿での評価:不错 すばらしい,よい
               还好 まずまずよい
                    およそ半々です.
    “百度”のブログで中国人の利用者の記事もみましたが、
    細部の不満はあるものの概ね好評です。
ダウンロード先は、画面右側に沢山あります。
忙・中・閑 状況表示が出ていますがあまり当てになりません。
30分~小一時間かかるでしょう。
*AppLocaleのinstallもWin7-64bitの場合工夫が必要です。
■少量の場合で、拼音入力が面倒(拼音が分からない)な場合に有効なものがあります。
名称はCOCR2、特徴と制約は、
負荷が軽い。
 拼音を知らなくてもよい。
 scnner連動しない。
 .bmpしか入力に使えない。
 一文字づつ手作業変換。
中文画像を中国語OCRでテキスト化する方法
 http://chn.owlnet.jp/tips5.htm
  ここに説明があります。
  ここからダウンロード クリックで以下へ飛びます(英文)、
   http://users.belgacom.net/chardic/cocr2.html#dow …
     cocr2_100.zip よりも、少し先にある mirrorから入って、
    自分で用意した所へ保存後installする方が良いでしょう。
*scanner連動しない、かつビットマップ原稿しか読めないので、事前に自分で原稿をscanして.bmpで保存しておきましょう。
これをCOCR2で読むときはfile→[LoadImage]で。
*試しに使ってみましたが、簡単です。中国出版の書籍で紙質がまあまあ(淡黄色、紙肌の毛羽や粗目の少ないもの)を300bpiでscanして使いましたが、識字の度合いは合格でした。
*拼音は不得手でも繁簡体字の知識のある秘書などが、単純作業として使うのにはよろしいかも知れません。
    • good
    • 0
この回答へのお礼

再度、ありがとうございます。

尚書7号のインストール・ダウンロードまで試して下さったとのこと、お礼の言葉もございません。
教えてくださったCOCR2が費用対効果が高そうですので、ひとまずこちらを利用してみることにします。
それにしても今は本当に便利な手段が何種類もあるのですね。感動いたしました。
一文字一文字を部首から入力したり、外字作成していた世代にとっては夢のようです。

このQ&Aサイトを利用して数年になりますが、こちらの回答者様ほど懇切丁寧で有益な回答を寄せていただいたのは初めてです。心よりお礼を申し上げます。
今後ともどうぞよろしくお願いいたします。

お礼日時:2011/08/02 23:53

コピーした文書の利用は貴責任であることをを前提にご案内します。



OCRテキスト化&繁簡繁変換&文書化の有料ソフトで便利なものがありますが、概ね翻訳ソフトと一体化した販売なので高価です。
これは実績もありお奨め、単体でも2万円近いですね。
 http://www.garitto.com/mygaritto/bookmark_produc …

OCRでPDFへの取り込みかつテキスト化のソフトウェアは既にお持ちですか。
以下はwordで説明しますので、PDFの作成・書き込みライセンスをお持ちでしたら、適宜PDFに置き換えてください。

必要なのは、OCRソフトと繁簡変換ソフト、有料のものは措いて、無料のものを。
1.無料OCRソフトウェアです。
■中国語OCR無料ソフトウェア。
「尚書七号OCR」--繁体字,簡体字とも可.中国製。
 http://pcarekore.blogspot.com/2009/03/ocrocr.html
 丁寧な説明があります。
 変換後のテキスト保存はWordpad(.rtf)のようですから、
 そのまま.docでの書き込みも、Wordfileへのコピペも自由です。
■上記の説明にありますが、Ms AppLocale も必要です。
以下が参考サイトです。Win-XPとWin7で異なるので注意。
AppLocaleでアプリケーションの文字化け解消 | AppLocaleの使い方
 http://ameblo.jp/ckoku-tshi/entry-10322227043.html
AppLocaleをWindows7にインストール。64bit版もたぶんOK。
 http://ameblo.jp/ckoku-tshi/entry-10750681620.html
  apploc.msiのインストールです
Microsoft AppLocale Utility-- Win7補助情報
 http://w7.vector.jp/softrev/detail.php?s_no=68923
2.繁簡変換ソフトです。Wordからコピペで使用。
■繁体字⇔簡体字 変換ソフトウェア無料です。
 http://bjkoro.net/chinese/letter/converter/
 http://hanyu.iciba.com/jianfan  など
 一回の変換字数制約があるので手間は覚悟です。
 この種のものは無料で沢山あります。
   http://www.baidu.com/ から、
   简繁转换 で沢山出てきます。何れも简繁/繁简両方向可。
 转换変換後テキストのコピペ自由です。

*OCRでテキスト化の過程で、誤読・判断困難な文字の手作業修正が付き物です。中国の書籍の紙質は歓迎できないものが多く誤読が多いので、特に大量文書には作業負担が懸念されます。
*貴殿と類似の必要から先日見つけたばかりのprogramで、installも未着手です。念のために直前にWindowsの復元ポイントを確認すれば、失敗しても心配ないので、近々installを考えています。
中国のprogramは無料でも有用なものがあるのでよく使います。ただ、余計な動作をしたり、同種の他の既存programを意図的に排除したり、はたまたuninstallしても意図的に残骸を残すものがあったり。更に、optionなどの設定説明が中国語ですから、その点も読解力が問題になる場合もあります。
*回答がつかないようなので、使用体験がないにもかかわらず紹介することになりましたが、ご了解ください。
    • good
    • 0
この回答へのお礼

親切なご回答をありがとうございました。

pdfへの取り込み自体、初めてですので、詳しくご教示いただいて本当に助かりました。
(触法行為は一切いたしませんので、その点はご放念ください。)

やはり、ある程度の手作業と目視確認は必要なのですね。分量が少なければ、手作業で入力したほうが速いかもしれないですね。
とはいえ、いずれ必ず大量作業をすることになるので、近いうちにご指導の通り試してみます。

すぐにもお礼差し上げたいところですが、まだ締め切らずにおきます。もし追加情報がございましたらよろしくお願いいたします。

お礼日時:2011/07/31 23:29

中国語バージョンのワードで変更機能が付きそうですが、日本語バージョンで見つけませんでした。

オンライン変更はいかがですか。下記http://gj.52hxw.com/tool.php#fanti
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

すでにテキストやdoc.ファイルになっているものであれば、こちらのサイトが便利そうですね。

教えてくださってありがとうございました。

お礼日時:2011/07/31 23:19

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報