c sharp、vs2010で開発しています。
http://www.shurey.com/js/labo/character2.html
上記を参考に半角カナや特殊文字をチェックするメソッドを作りました。
ただ、(株)あたりはちゃんとチェックできるんですが、≒とか、表にあるのに
うまくチェック出来ないものがあり悩んでいます。
問題箇所をご指摘いただけないでしょうか。
public static bool isSafeChar(string val)
{
Encoding sjisEnc = Encoding.GetEncoding("Shift_JIS");
byte[] bytes;
string chkCode = "";
int num16 = 0;
for (int i = 0; i < val.Length; i++)
{
bytes = sjisEnc.GetBytes(val[i].ToString());
chkCode = "";
foreach (byte item in bytes)
{
chkCode = chkCode + Convert.ToString(item, 16);
}
//10進数の整数に直す
num16 = Convert.ToInt32(chkCode, 16);
//半角カナ(00A0~00FF)を含むか
if (160 <= num16 && num16 <= 255)
{
return false;
}
//特殊文字(8540~889E)を含むか
if (34112 <= num16 && num16 <= 34974)
{
return false;
}
//縦文字(EB40~EFFC)を含むか
if (60224 <= num16 && num16 <= 61436)
{
return false;
}
//外字(F040~F9FC)を含むか
if (60224 <= num16 && num16 <= 61436)
{
return false;
}
}
return true;
}
No.5ベストアンサー
- 回答日時:
No4です。
16進数はC#他多くの言語で「0x」を頭につけて表記します。
https://ja.wikipedia.org/wiki/%E5%8D%81%E5%85%AD …
256を掛けて足すというのは、
int charCode = 0;
foreach (byte item in bytes)
{
charCode *= 256;
charCode += byte;
}
ということです。(多分動くつもりですが未チェック)
No.4
- 回答日時:
それは正しい動作です。
「≒」は、Shift_JISでは機種依存文字とそうでない文字の2種類がありますが、現在のPCは機種依存文字の方を使うことはできません。
機種依存文字の方を使おうとしても、Unicodeでは同じ文字なので、普通の文字の方に直されてしまいます。
問題点としては、すでに指摘があるように、これはShift_JISに含まれない文字をチェックできません。
Encoding.EncoderFallbackでたぶん設定できます。
他に気になる点がいくつかあります。
・半角カナはA0~FFでなくA0~DFです。
・2バイトを数値に変換する部分ですが、これでは下位バイトが0F以下のとき正しい数値になりません。ただしShift_JISコードを扱う限りは問題ありません。
・そもそも文字に直して数字に戻すのは無駄が多いので256を掛けて足せばいいでしょう。
・文字コードを10進数で書いてわかりづらくないですか?
・「外字」の部分の数値が「縦文字」と同じになっています。
・またそもそもこの2つは隣接しているので1つの範囲にしたほうが楽でしょう。
この回答への補足
ありがとうございます。
shift_jisに含まれないものは置換フォールバックをし、NGにしました。
>文字コードを10進数で書いてわかりづらくないですか?
これなのですが、16進数のままチェックできるものでしょうか?
ご教授いただければ幸いです。
すみません、
>そもそも文字に直して数字に戻すのは無駄が多いので256を掛けて足せばいいでしょう
これについても掘り下げて教えていただけないでしょうか。
No.2
- 回答日時:
あなたが何をどうしたいのかイマイチ分かりませんし、何がどう問題なのか具体的には分かりません。
ただ「≒とか、表にあるのにうまくチェック出来ない」といっているあたりから、おそらくは「機種依存文字」の理解が間違っているもしくはあなたの文字認識が不正確というオチなだけの気がします。まず「≒」に見える文字でも「8790」と「81E0」にあります。見た目が同じなら何でもいいわけではありません。どちらをチェックしたのでしょうか?
「8790」ならば「特殊文字(8540~889E)を含むか」のチェックで引っかかると思いますが、「81E0」ならばスルーするでしょうし。
どちらなのか自分でも分からないというのであれば、まずは自分が何をチェックしようとしているのかきちんと把握するところから始めましょう。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
このQ&Aを見た人はこんなQ&Aも見ています
-
これまでで一番「情けなかったとき」はいつですか?
これまでの人生で一番「情けない」と感じていたときはいつですか? そこからどう変化していきましたか?
-
スマホに会話を聞かれているな!?と思ったことありますか?
スマートフォンで検索はしてないのに、友達と話していた製品の広告が直後に出てきたりすることってありませんか? こんな感じでスマホに会話を聞かれているかも!?と思ったエピソードってありますか?
-
これが怖いの自分だけ?というものありますか?
人によって怖いもの(恐怖症)ありませんか? 怖いものには、怖くなったきっかけやエピソードがあって聞いてみるとそんな感覚もあるのかと新しい発見があって面白いです。
-
【選手権お題その1】これってもしかして自分だけかもしれないな…と思うあるあるを教えてください
「出身中学と出身高校が混ざったような校舎にいる夢を見る」「まぶたがピクピクしてるので鏡で確認しようとしたらピクピクが止まってしまう」など、 これってもしかして自分だけかもしれないな…と思うあるあるを教えてください
-
【選手権お題その2】この漫画の2コマ目を考えてください
サッカーのワンシーンを切り取った1コマ目。果たして2コマ目にはどんな展開になるのか教えてください。
-
機種依存文字の変換について
C言語・C++・C#
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・「みんな教えて! 選手権!!」開催のお知らせ
- ・漫画をレンタルでお得に読める!
- ・【選手権お題その2】この漫画の2コマ目を考えてください
- ・2024年に成し遂げたこと
- ・3分あったら何をしますか?
- ・何歳が一番楽しかった?
- ・治せない「クセ」を教えてください
- ・【大喜利】看板の文字を埋めてください
- ・【大喜利】【投稿~12/17】 ありそうだけど絶対に無いことわざ
- ・【選手権お題その1】これってもしかして自分だけかもしれないな…と思うあるあるを教えてください
- ・【穴埋めお題】恐竜の新説
- ・我がまちの「給食」自慢を聞かせてっ!
- ・冬の健康法を教えて!
- ・一番好きな「クリスマスソング」は?
- ・集合写真、どこに映る?
- ・自分の通っていた小学校のあるある
- ・フォントについて教えてください!
- ・これが怖いの自分だけ?というものありますか?
- ・スマホに会話を聞かれているな!?と思ったことありますか?
- ・それもChatGPT!?と驚いた使用方法を教えてください
- ・見学に行くとしたら【天国】と【地獄】どっち?
- ・これまでで一番「情けなかったとき」はいつですか?
- ・この人頭いいなと思ったエピソード
- ・あなたの「必」の書き順を教えてください
- ・10代と話して驚いたこと
- ・14歳の自分に衝撃の事実を告げてください
- ・人生最悪の忘れ物
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
UTF-8で5~6バイトになる文字コ...
-
エクセルシート名の制限を変更...
-
10Mバイトて文字数に すると何...
-
Excel VBA で Oracle CLOB型カ...
-
100MB
-
VBAでUnicodeしか存在しない文...
-
[VBScript][wsh]byte単位でのデ...
-
バイト列とバイナリ列の違いが...
-
文字列の最後の一字を削除
-
より高速な画像の表示法
-
文字コードの利点・欠点について
-
COBOLのCOMP形式について
-
PICマイコンで変数値の保持
-
C++ Builderで文字列をバイトに...
-
文字数の限界
-
3バイト文字(UTF-8)をprintfで...
-
ワイド文字のバイト数が取得で...
-
VBAでShift-JISのURLエンコード
-
IEレジストリのSavedLegacySe...
-
char str[256]の256の意味は?
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
エクセルシート名の制限を変更...
-
UTF-8で5~6バイトになる文字コ...
-
10Mバイトて文字数に すると何...
-
COBOLのCOMP形式について
-
char str[256]の256の意味は?
-
バイト列とバイナリ列の違いが...
-
C++ Builderで文字列をバイトに...
-
VBAでShift-JISのURLエンコード
-
機種依存文字をチェックしたい。
-
「1TB」のHDDに日本語は何字入...
-
GetWindowTextでアドレスバーか...
-
ピクセル,dpiから容量(バイト...
-
【VB2005】テキストボックス内...
-
URLは最高何文字まで可能なので...
-
64bit対応
-
UCS-2の一覧表が欲しい
-
VBAでUnicodeしか存在しない文...
-
SQLで1バイト、2バイト混在...
-
ビットスワップとバイトスワッ...
-
CRC計算方法
おすすめ情報