
No.2ベストアンサー
- 回答日時:
半角文字は最上位ビットを見ればわかるので定義しなくても判別は出来ます。
問題は40バイト目が全角文字(最上位ビットが1)の場合にそれが1バイト目なのか2バイト目なのか3バイト目(補助漢字は3バイトになるのがEUCの欠点ですね)なのかの判断が出来ないことです。
例えば"aいいいい"という文字列はEUC-JPでは
0x61, 0xA4, 0xA4, 0xA4, 0xA4, 0xA4, 0xA4, 0xA4, 0xA4
になります。
結局、文字列の最初から1バイトずつ順番にチェックしていくしかないのではないでしょうか。
No.1
- 回答日時:
EUCコードについて調べてみれば分かりますが、
1バイト目が、0xA1 ~ 0xFEの場合は、2バイト文字として扱われるようです。
そして1バイト目が、0x8Eだった場合は、次の文字を半角カタカナとして扱います。
質問によると、40バイト取得したいとのことですが、単純に40バイトで切るのなら40バイト分コピーして、
後ろの文字と、その一つ前を判定すれば良いと思います。
でも、半角40文字分の文字列の取得となると、半角カタカナも2バイトで表現されるため、
1文字ずつ判定しながらコピーしなくてはいけません。
気を付けなければならないのが、文字列判定時にcharではなくてunsigned charを使うということです。
これについては、コンピュータ内の負の数の表現方法を勉強すれば分かると思います。
参考URL:http://www.unixuser.org/~euske/doc/kanjicode/ind …
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Excel(エクセル) capeofdragonと申します Excel2016を使っておりまして 半角又は全角の任意文字列が 2 2022/10/31 13:51
- その他(データベース) Accessのクエリで1フィールドの抽出条件設定をNullでなく全角半角含む空白のみの文字列でない文 1 2023/04/24 15:20
- Visual Basic(VBA) 特定の文字を簡単な操作で半角スペースに変換するか削除したい 2 2022/11/01 10:35
- Access(アクセス) Accessのテキストボックスの入力文字制限 1 2023/01/18 20:43
- Android(アンドロイド) 海外のAndroid 端末の場合、日本語全角は、どう表示されるのでしょうか? 1 2022/10/02 21:16
- Excel(エクセル) エクセルの数式で教えてください。 1 2023/02/02 10:20
- Ruby 1、Rstudioで回帰直線を求めるために必要な関数はなにか?アルファベット2文字で答えよ。 2、r 1 2022/08/03 11:38
- Excel(エクセル) エクセルの数式で教えてください。 3 2022/10/25 10:52
- その他(ソフトウェア) ソースネクストアプリをインストールし、製品登録で半角英数字が入力できない 5 2022/07/03 22:44
- その他(Microsoft Office) WordやExcelで英数字のみ半角または全角にしたい 6 2022/08/03 08:18
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
UTF-8で5~6バイトになる文字コ...
-
テキストBOXの入力制限について
-
COBOLのCOMP形式について
-
10Mバイトて文字数に すると何...
-
全角半角を調べるライブラリ関...
-
URLは最高何文字まで可能なので...
-
バイト列とバイナリ列の違いが...
-
エクセルシート名の制限を変更...
-
:(コロン)のKeyCode
-
2バイト文字の判定はString#get...
-
jis x 0208 について
-
varchar(M)のMは文字数ですかバ...
-
この関数はどのプログラミング...
-
VB6とSQL Serverの桁の扱い方に...
-
文字列の最後の一字を削除
-
文字コードの利点・欠点について
-
char str[256]の256の意味は?
-
fortranで、C言語のsizeof関数...
-
「1TB」のHDDに日本語は何字入...
-
Visual Basicでパック10進(2進...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
UTF-8で5~6バイトになる文字コ...
-
10Mバイトて文字数に すると何...
-
COBOLのCOMP形式について
-
char str[256]の256の意味は?
-
エクセルシート名の制限を変更...
-
バイト列とバイナリ列の違いが...
-
VBAでShift-JISのURLエンコード
-
機種依存文字をチェックしたい。
-
ピクセル,dpiから容量(バイト...
-
GetWindowTextでアドレスバーか...
-
この関数はどのプログラミング...
-
ソケット通信の受信サイズ
-
:(コロン)のKeyCode
-
COBOL PICTUREで X,S,Vの意味
-
memcmp バイナリデータの比較方法
-
より高速な画像の表示法
-
半角、全角の判別方法
-
最大長を用意せずにバイナリデ...
-
64bit対応
-
バイナリとBCDコード
おすすめ情報