プロが教えるわが家の防犯対策術!

最初に環境ですが

Mac およびWindowsで
正規表現が使えるエディタを利用してます。

MacならCotEditor
Winなら秀丸エディタです。

文字コートはunicodeもしくは
shift-jisです。

---

ここから質問なのですが

漢字の文字コードを指定して検索しても
漏れてしまう場合があります。

全ての漢字を指定する場合
[亜-黑] とする、と聞いたのですが


例えば
検索:[亜-黑]
としても

世  という文字はヒットしません。


常用漢字以外の特殊な漢字であったり
機種依存文字の漢字ならヒットしないのも
理解できるのですが

【世】は常用漢字であり機種依存文字でもないので
不思議に思ってます。


[亜-黑]という指定は
文字コードでの範囲指定かと思いますが
その中から【世】は漏れているということでしょうか。

また、漏れているのであれば
他に漏れている漢字(常用漢字)はどれくらいあるのでしょうか。
*代表的なものだけでもいいです。


アドバイスをいただけると助かります。

A 回答 (2件)

[亜-黑]はJISの第1・第2水準とWindowsの機種依存文字ですね。

第3水準は無関係です。
Unicodeでは全く順番が異なりますが、奇偶にも亜はわりと最初の方、黑はわりと最後の方なので大半の文字が含まれていますね。(なので間違いに気付きにくいので不運なことです)

Unicodeですと、日本語の漢字のみという指定はできませんが、中国語などの漢字も含んでよいのであれば、
[一-龠]がJIS第1・第2水準すべてを含み、漢字以外を含まないので比較的おすすめです。
(なおWindows機種依存文字はすべては含みません)
    • good
    • 0
この回答へのお礼

ありがとうございます。
オススメの[一-龠]を早速、使ってみます。

ベストアンサーとさせていただきます。

お礼日時:2019/07/02 13:11

>[亜-黑] とする、と聞いたのですが


JISあるいはShift-JISなら漢字全部(第1水準から第3水準)になりますがUNICODEではそうなりません。

漢字(中国語のフォントや漢字もどきも含めて)が飛び飛びになるので正規表現とするのは難しいかもしれませんね。
    • good
    • 0
この回答へのお礼

ご回答、ありがとうございます。参考になりました。

お礼日時:2019/07/02 13:09

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!