シフトJISの2バイト文字の範囲は
0x40~0x7e と 0x80~0xfc
と
0x40~0xfc
のどっちですか?
どちらの情報も見たことがあるんです。
シフトJISの文字をマッチングさせる場合、
ここでは見やすく、スペースを入れて
/ [\x81-\x9f] [\x40-\xfc] | [\xe0-\xfc] [\x40-\xfc] /
とした場合、例えば、亜a という文字列があったら
亜 の2バイト目(下位ニブルっていうのかな)が 9F で
b は16進で 62 だから、亜 の2バイト目と a が、
2バイトのシフトJISとしてこれにマッチしてしまうんです。
シフトJISで、こういう例外処理を書かずに、
全てに適用できるシフトJIS2バイトマッチのソースが
あれば教えてください。
No.2
- 回答日時:
シフトJISの2バイト目のコードは、
0x40~0x7E 及び 0x80~0xFC
です。
0x7Fは含みません。
で、2バイトシフトJISにマッチさせるなら、
/([\x81-\x9F\xE0-\xFC][\x40-\x7E\x80-\xFC])/
と書けばOKなはずです。
[…]という文字集合を使用しているのだから、2パターンに分ける必要はないですよ。
No.1ベストアンサー
- 回答日時:
「0x40~0x7e と 0x80~0xfc」だと思いますよ。
「亜a」に対してマッチングするのではなく、前から2バイトずつマッチングして、マッチしたら2バイト進み、マッチしなかったら1バイト進むというようにしないとダメでは?
0x7fの例外処理?を除くことはできないですよね。
参考URL:http://www.sowa.is.uec.ac.jp/~ueno/material/kanj …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- C言語・C++・C# S-JIS → JIS コード変換するには 3 2023/02/09 23:55
- その他(IT・Webサービス) 電気ガスの手続きで文字を入力したいのですが、入力したい文字がアルファベットなんです。ですが、文字がJ 1 2023/05/14 18:00
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- その他(ビジネス・キャリア) JISの表記について 1 2023/07/06 14:35
- Java VScodeのターミナルの文字化けについて 1 2022/09/27 22:19
- アルバイト・パート バイトを辞めたいです 6 2022/09/22 16:08
- アルバイト・パート 友人のバイト先について アルバイトのシフトについてです。高校生です。 出勤出来る人がほぼおらず、人手 2 2022/12/13 23:35
- アルバイト・パート バイトのシフト 2 2023/04/03 13:56
- アルバイト・パート みなさんが今コンビニでバイトをしている学生だとします。 バイトはシフト固定で毎週月曜日と木曜日は17 5 2023/05/12 19:40
- アルバイト・パート 親がバイトのシフトを管理してきます。高校1年の女です。私はまだバイトを始めたばかりで、はやく仕事に慣 3 2022/08/14 17:57
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
10Mバイトて文字数に すると何...
-
UTF-8で5~6バイトになる文字コ...
-
COBOLのCOMP形式について
-
エクセルシート名の制限を変更...
-
ビットスワップとバイトスワッ...
-
バイナリとBCDコード
-
memcmp バイナリデータの比較方法
-
char str[256]の256の意味は?
-
Javaで日本語1文字のバイト数
-
機種依存文字をチェックしたい。
-
3バイト文字(UTF-8)をprintfで...
-
unicode←→JISコード
-
ビットからバイトへの変換
-
2byte文字の判定
-
[VBScript][wsh]byte単位でのデ...
-
varchar(M)のMは文字数ですかバ...
-
バイト列とバイナリ列の違いが...
-
【VB】文字列を50バイトづつに...
-
ソケット通信の受信サイズ
-
0.5バイトづつ読み込みたいので...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
10Mバイトて文字数に すると何...
-
UTF-8で5~6バイトになる文字コ...
-
char str[256]の256の意味は?
-
エクセルシート名の制限を変更...
-
COBOLのCOMP形式について
-
バイナリとBCDコード
-
バイト列とバイナリ列の違いが...
-
ビットスワップとバイトスワッ...
-
ピクセル,dpiから容量(バイト...
-
SQLで1バイト、2バイト混在...
-
Javaで日本語1文字のバイト数
-
「1TB」のHDDに日本語は何字入...
-
機種依存文字をチェックしたい。
-
VBAでShift-JISのURLエンコード
-
GetWindowTextでアドレスバーか...
-
COBOL PICTUREで X,S,Vの意味
-
【VB2005】テキストボックス内...
-
URLは最高何文字まで可能なので...
-
1KBが1024byteな理由
-
ワイド文字のバイト数が取得で...
おすすめ情報