プロが教える店舗&オフィスのセキュリティ対策術

Windows2000を使っています。

何かのプログラム処理中の変換ミスなどで出現した、
JIS第1、第2水準ではない漢字のコードを知る方法はないでしょうか。
例えばこの字ですが、
「懬」(おそらく、アップした時点で文字化けすると思います)

「やまだれ(广)」の中に「黄」、その下に「心」との字体です。
メモ帳等で保存しようとすると、?に文字化けします。

IMEパッドで、総画数19画、「コウ」「ヒロ・い」と読むことは見つけられましたが、
これの文字コードがいくつだったのかが分かりません。
(もともと、どんな文字コードが化けて、こんな文字が現れたのかを調べたりしたいのですが)

ネットで検索するにも、上記同様、「?」に化けてしまいますし、
http://www.eonet.ne.jp/~kotobukispace/ddt/jisx02 …
などで、目で探しても見つけられませんでした。
(画像データなので、検索ができず・・・)

何か、良い方法がありましたら、是非ご教示ください。

A 回答 (3件)

書籍 (“Unicode Standard, Version 5.0) は高額ですので、


http://www.amazon.co.jp/gp/product/0321480910/sr …
多少手間はかかっても、インターネットで検索するのがいいと思います。
今回お尋ねの字で説明します。
お尋ねの字を[廣]+「心」と分析すれば、部首は「心」になります。
お尋ねの字から[广]を取り除いたものは、一つのユニットを形成しない二個のパーツになりますから、「广」が部首である可能性は低いと言えますが、
漢和辞典の配属ですら適切でないものがありますから、Unicodeの場合はなおさらで、「广」部に入れている可能性も排除はできません。
また[黄]の部分の字形・画数に二通りあることも考慮する必要があります。

http://www.unicode.org/charts/unihan.html
Unihan Database>Unihan Radical-Stroke Index
Strokes in Radicalの項で、「心」は4画なので4をクリック
「心 heart」を選択、
Additional strokesの項で14画・15画両方の可能性を考慮し、
Minimum:14 Maximum:15
として、[Submit]ボタンをクリック
少し待たされますが、15画の6番目に目的の字があります。
(字形は略字なのに、画数は正字で数えています。
MS明朝、MinLiU、New Gulimの字形は正字です。)
この字をクリックすると#1のと同じ画面になります。
ここで U+61EC というUnicodeを知ることができます。


[余説]
Unihan Database>Unihan Grid Index

◇CJK Unified Ideographs Extension A (U+3400 through U+4DB5) =CJK統合漢字拡張A領域
「34」をクリックしてみましょう。
ページ表示にちょっと時間がかかります。
列は縦で左から右です。
[七]×3の「喜」の異体字はU+3402であって3420ではありません。
U+3427「第」の略字、U+34DB「功」の異体字などが見えますね。
XPか2000なら、この領域の文字すべて、New Gulimというフォントで表示可能です。
#1に書いた方法で、[ U ][ 3 ][ 4 ][ 0 ][ 2 ][ F5 ]、クリック、[Enter]で確定。
もし文字が表示されなくても、ドラッグしてNew Gulimにすれば、変身します。
Word2002以降なら、半角で 3402[Alt]+[X] と打ってちょっと待てばダイレクトに変換されます (フォントは上記と同様に)。
* 例に挙げた「喜」「功」の異体字は JIS X 0213 面区点:1-14-03, 1-14-59 (第三水準) に定義されたので、
Vista 搭載のMS書体には加えられています。
「第」の略字は第三・第四水準に入らなかったので、加えられていません。

◇CJK Unified Ideographs (U+4E00 through U+9FA5) =CJK統合漢字
これは説明不要ですね。
New Gulimのほか、MingLiU、SimSun、SimHeiで全文字が表示・印刷できます。
MS(P)明朝、MS(P)ゴシックは、JIS第一・第二水準のほか、補助漢字を収録しています。

◇CJK Compatibility Ideographs (U+F900 through U+FA2D) =CJK互換漢字
文字が表示されないようなので、
http://www.unicode.org/charts/PDF/UF900.pdf
で見てください。
ここにはCJK統合漢字では「包摂」の概念により、中国・日本・韓国が一つのコードに別々の字を割り当てたけれども、
やはり複数の字体を併存させたいという希望に対応したものです。
たとえばCJK統合漢字U+6D77「海」は、中国・韓国では正字、
日本では[母]を[毋]に変えた略字になっています。
日本でも正字が使えるようにU+FA45にその字を定義したのです。
中国・韓国では重複になります。
その逆もあります。

◇CJK Unified Ideographs Extension B (U+20000 through U+2A6D6) =CJK統合漢字拡張B領域
この領域の文字を網羅したフォントはたぶんまだないと思います。
WindowsXP以降でなければ、対応できません。
A領域と同様、「弓巾」(一字) のように第三・第四水準に入った字はVistaで使えます。
http://www.unicode.org/cgi-bin/GetUnihanData.pl? …
[土]+[口]の「吉」の異体字のような字はヒラギノ明朝 Pro W3 なら使えます。
http://www.unicode.org/cgi-bin/GetUnihanData.pl? …
[龍]×4の字は作字しないと使えません。
http://www.unicode.org/cgi-bin/GetUnihanData.pl? …

◇CJK Compatibility Ideographs Supplement (U+2F800 through U+2FA1D) =CJK互換漢字補遺
前記同様表示されないので、
http://www.unicode.org/charts/PDF/U2F800.pdf
で見てください。

長々と書いてしまいました。お許しください。

参考URL:http://www.unicode.org/charts/unihan.html
    • good
    • 0
この回答へのお礼

懇切に解説してくださり、大変ありがとうございました。
良い方にお会いできて光栄です。
もともとやりたかったこともすべて達成できました。
「Strokes in Radical」の中で、部首探しにセンスが必要そうでしたが、
調べたかった各難解漢字を構成しているパーツを1つ1つ順に調べて
いけば、それほど時間は掛かりませんでした。

他にも勉強になりましたし、本当にありがとうございました。
(逆に、お礼が短文すぎて、恐縮の限りです・・・・)

お礼日時:2006/11/09 20:11

締め切らずに待っていただければ、責任をもって本日中に回答します。

    • good
    • 0
この回答へのお礼

いま、No.3の回答を拝見しており、感動しているところです。
通り一遍のことをやってみたいと思います。
とりあえず、途中報告です。ありがとうございます。

お礼日時:2006/11/09 19:18

その文字はUnicode:U+61ECに定義されています。


MS明朝やMingLiUでは「黄」が旧字体 (「廣」に含まれるもの) ですが、SimSunなどの中文フォントでは常用漢字の「黄」と同じで画数が違いますね。
Unicode Standard の字体は後者です。
http://www.unicode.org/cgi-bin/GetUnihanData.pl? …

MS IME 全角[ あ ]モードで [ U ][ 6 ][ 1 ][ E ][ C ]のキーを押し、
(表示は う61えc )
続けて[ F5 ]を押せば、文字一覧の当該字がポイントされていて、
Unicode:0x61ec
と表示されるはずです。

この回答への補足

ご回答ありがとうございます。
F5キーで部首変換とかするんですね!隠しコマンドみたいな...へぇ!?×5でした。
ただ、問題は、そのコードが「U+61EC」であるということを
知るためにどうするかがあります。
(今回は、garamondさんに教えて頂けたので「コウ」の字が「U61EC」であることが分かったのですが、
他にも同様に調べたい文字がいくつかあるのです・・)
教えて頂いた、「Unihan database」のページで、上手く探せませんでした。
(テキストボックス内に該当文字を貼り付けて、LookUpボタンを押して探すのかと思いましたが、
"NULL"という文字コード0000のページが表示されます)

補足日時:2006/11/09 08:52
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!