プロが教えるわが家の防犯対策術!

お世話になっております。

UNICODEに存在して、JISに存在しない文字の置換をしたいと思っております。
対象は、一般的に日本で使用する漢字、
たとえば、
補填→ほてん
等に変換してくれるソフト・変換表をご存じないでしょうか?
※完璧でなくても結構です。

何卒よろしくお願いいたします。

A 回答 (1件)

別途、先にあったご質問もそうなのですが文字コードの変換と言葉の置換を混ぜて考えておられるようです。


「補填」を「ほてん」と置換するのは「変換先の文字コードに填が無いため補填という熟語自体を平仮名表記に変換する」ことです。これを実現するには文字コード変換だけでなく文書解析を行い、文書の構成要素ごとに取り出して1文字ずつ文字コードの変換をし、変換できない文字が含まれていたら読みを調べて平仮名表記に変える、、、という処理が必要です。

「補填」を「補てん」とするのもほぼ同様で、この場合は「ほてん」という読みを理解した上で変換先のコードがない「填」に対して「補填」という言葉の場合の読みである「てん」に変える処理が必要です。
つまり、「補填」は「ほてん」と読み、その際「補」が「ほ」で、「填」が「てん」という読みである、、、という辞書を必要とします。

人はカナ漢字変換で「ほてん」と入力した際、「補填」、「補てん」、「ほてん」、「ホテン」といった変換候補の中から適切な物を瞬時に選びぶ事が出来ますが、これをソフトウェアで正確に行わせようとすると結構な手間とそのための情報(辞書)が必要になるのです。
ということで今すぐ最も手早く出来るのは変換元と変換先の文字コード表を参照して変換先に無い文字コードの一覧を作成し、文字コードの変換対象とする文書をフォント指定機能、検索機能、再変換機能を持った文字エディター(Wordなど)に入れ、文字検索で対象文字を探して手動で変換することかと思います。

なお、「変換先の文字コードに対象文字が無い」という意味が「異体字」を指すのでしたら事情が少々異なるように思います。
既にいろいろと勉強されておられるおだと思いますが、以下のWikipediaの「異体字セレクター」の説明ページ、特に「互換漢字との関係」以下をお読みになられるとよいかと思います。

https://ja.wikipedia.org/wiki/%E7%95%B0%E4%BD%93 …

参考まで。
    • good
    • 0
この回答へのお礼

ご連絡ありがとうございます。

変換元:補填、変換先:ほてん
という形で置換するソフトがないのか探しています
※上記は、一例です。

よろしくお願いいたします。

お礼日時:2017/09/21 13:00

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!