No.3ベストアンサー
- 回答日時:
sjisだと、そのデータの任意の1バイトを取り出したとき,
1バイトのコードか、2バイト文字の2バイト目のコードか区別できないことでしょう。
よく見かけるのがsjisの漢字コードの2バイト目に
ファイルのセパレータである\が含まれる文字によるバグや、
日本語文字コードを意識していないプログラムに漢字を
与えた場合の誤動作です。
本来は漢字の一部なのに¥が含まれているために、
ディレクトリの区切りとして誤動作します。
まあ、全てのプログラムがきちんと作られていれば
問題無いわけですが,手間がかなり余分にかかります。
EUCやJIS方は区別がつくためこの問題は生じません。
また、これは英語圏の環境で日本語文字データを読み込んだ場合に問題を発生するかも知れません。
EUCは俗称で半角カナと呼ばれる文字を表現するのに
3バイト必要なので、これは欠点になりうるかも。
また、sjis,EUC両方の欠点として,多言語化かできません。
例えば,日本語、中国語、韓国語の文字の混在ができません。
また、どちらも8ビットを使うコードですので、環境によっては問題を起こす場合があります。
元々文字コードは7bitという前提で書かれていたことがあり、
そういう環境が無いと保証できない場合があり得るからです。
wwwの文字コードとしては本来はJISを使うべきかも知れません。
もともと通信という外部とやり取りする物はJISで
なければいけないような話があったはずです。
sjisが多いのは,単にその文字コードを基本とする
WindowsやMacの文字コードが無造作にそのまま
ページとしておかれるためでしょう。
私は自分のページはわざわざjisコードにしてます。
No.2
- 回答日時:
シフトJISもEUCも利点、欠点というのはあまりありません。
結局は文字コードの取り決めなのです。
しいて言うなら、サイズが違うといったくらいです。
シフトJISなら、1文字を表現するのに最大で2Byte、
これに対してEUCは最大3Byte必要とする時があります。
どちらを使うかといえば、結局は開発環境の文字コードに合わせるのが自然です。
htmlをテキストエディタで表示する時などにもスムーズですしね。
(秀丸のような自動判別してくれるのもありますが・・・。)
No.1
- 回答日時:
ホームページでシフトJISが多く見られるのは、近年、圧倒的に一般家庭のパソコンでホームページを作る人が増えたためでしょう。
シフトJISはもともとマイクロソフトが開発した文字コードで、インターネットとの親和性はあまりありませんでした。
EUCは拡張ユニックスコードの略であることからもわかるとおり、UNIX系OSで古くから使われてきた文字コードです。
インターネットはもともとUNIX中心の文化だったため、古くからの大学・研究所系のサイトでEUCが細々と、しかし根強く残っています。
CGIなどサーバ上で動かすスクリプトプログラムは、EUCとの相性がいいです。
これは、シフトJISのコード体系をCGIスクリプトに通すためには特殊の工夫をしなければならないためで、EUCならそうした心配をする必要がなく、誤動作や文字化けの確率が抑えられます。
スクリプトを動かさない普通のページであれば、シフトJISで何ら問題はありません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
- ・ゆるやかでぃべーと タイムマシンを破壊すべきか。
- ・歩いた自慢大会
- ・許せない心理テスト
- ・字面がカッコいい英単語
- ・これ何て呼びますか Part2
- ・人生で一番思い出に残ってる靴
- ・ゆるやかでぃべーと すべての高校生はアルバイトをするべきだ。
- ・初めて自分の家と他人の家が違う、と意識した時
- ・単二電池
- ・チョコミントアイス
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
エクセルシート名の制限を変更...
-
UTF-8で5~6バイトになる文字コ...
-
10Mバイトて文字数に すると何...
-
バイト列とバイナリ列の違いが...
-
char str[256]の256の意味は?
-
COBOLのCOMP形式について
-
URLは最高何文字まで可能なので...
-
UCS-2の一覧表が欲しい
-
VBAでUnicodeしか存在しない文...
-
:(コロン)のKeyCode
-
PICマイコンで変数値の保持
-
文字数を取得したい
-
3バイト文字(UTF-8)をprintfで...
-
64bit対応
-
コンピューターのデーターの扱...
-
[VBScript][wsh]byte単位でのデ...
-
UTF-8とUTF-16およびUTF-32につ...
-
C言語において2バイト文字を検...
-
参考書3冊調べましたが!? ...
-
VBAでShift-JISのURLエンコード
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
10Mバイトて文字数に すると何...
-
UTF-8で5~6バイトになる文字コ...
-
エクセルシート名の制限を変更...
-
char str[256]の256の意味は?
-
COBOLのCOMP形式について
-
バイト列とバイナリ列の違いが...
-
ビットスワップとバイトスワッ...
-
VBAでShift-JISのURLエンコード
-
ピクセル,dpiから容量(バイト...
-
「1TB」のHDDに日本語は何字入...
-
SQLで1バイト、2バイト混在...
-
バイナリとBCDコード
-
Javaで日本語1文字のバイト数
-
UCS-2の一覧表が欲しい
-
3バイト文字(UTF-8)をprintfで...
-
:(コロン)のKeyCode
-
【VB2005】テキストボックス内...
-
64bit対応
-
URLは最高何文字まで可能なので...
-
機種依存文字をチェックしたい。
おすすめ情報