EUCのダブルバイト文字の判定

解決済

質問者：iyanarch
質問日時：2003/02/16 00:17
回答数：2件

EUCでダブルバイト文字の1バイト目と、そうでない普通のEUCの文字とを
区別することはでますか？
もしできたら、EUCのダブルバイト文字の1バイト目の領域を教えて下さい。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： leaz024
回答日時：2003/02/16 16:14

EUCには、２バイト文字の他に３バイト文字もあります。

各文字のコード範囲は、以下の通りです。

２バイト文字
・１バイト目　　0x8E , 0xA1 ～ 0xFE
・２バイト目　　0xA1 ～ 0xFE

３バイト文字
・１バイト目　　0x8F
・２バイト目　　0xA1 ～ 0xFE
・３バイト目　　0xA1 ～ 0xFE

すべて ASCIIコード（0x00 ～ 0x7F）以外で構成されているわけですが、ほとんどの部分でコード範囲が重複しています。
このため、「ある文字列のｎバイト目が、何バイト文字の何バイト目か」を判別するには、文字列先頭からチェックをするしかありません。