プロが教えるわが家の防犯対策術!

EUCでダブルバイト文字の1バイト目と、そうでない普通のEUCの文字とを
区別することはでますか?
もしできたら、EUCのダブルバイト文字の1バイト目の領域を教えて下さい。

A 回答 (2件)

こちらが参考になりませんか。


http://euc.jp/i18n/charcode.ja.html

参考URL:http://euc.jp/i18n/charcode.ja.html
    • good
    • 0

EUCには、2バイト文字の他に3バイト文字もあります。


各文字のコード範囲は、以下の通りです。

2バイト文字
・1バイト目  0x8E , 0xA1 ~ 0xFE
・2バイト目  0xA1 ~ 0xFE

3バイト文字
・1バイト目  0x8F
・2バイト目  0xA1 ~ 0xFE
・3バイト目  0xA1 ~ 0xFE

すべて ASCIIコード(0x00 ~ 0x7F)以外で構成されているわけですが、ほとんどの部分でコード範囲が重複しています。
このため、「ある文字列のnバイト目が、何バイト文字の何バイト目か」を判別するには、文字列先頭からチェックをするしかありません。
    • good
    • 1
この回答へのお礼

ありがとうございます。
日本語の文字数に対応した処理をすることができました。
3バイト文字があるなんて初めて知りました。
先頭からチェックしないとうまくいかないようですね。

お礼日時:2003/02/16 22:41

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!