A 回答 (2件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
文字コードの解説はされているので、残った
>EUCはなぜ制御文字を使って、1バイト仮名や補助漢字の文字コードを割り当てているのかも教えてください。
何故かというとその方式がISO2022という規格で定められているからそれに従っています。
さらに何故ISO2022でそう定められているかというと、別の文字セットへの切り替え指示は、今の文字セットに割り当てられていない範囲を使うしかないわけで、そう言う意味で制御コードの範囲にその機能が割り当てられています。
No.1
- 回答日時:
もう一つの質問とまとめてもよかった気がしますが…。
・旧JIS(JIS X 0201)(8bit)利点
ASCIIと同じバイト数で、ASCIIに加えてカナを扱える。
構造が単純。
欠点
漢字は扱えない
・新JIS(JIS X 0208)(7bit)利点
7bitしか使わないので昔の低性能な通信にも耐えた。(残り1bitで誤り検出)
扱う文字を増やそうと思えばいくらでも増やせる。
・欠点
ステートフルなので文字列の途中を見ても書いてある文字が分からない。
エスケープシークエンスの分容量がかさむ。
・Shift_JIS利点
旧JISの上位互換なので旧来の資源をそのまま使える。
半角カナを有効利用すると保存に必要なデータ量が新JISやEUCより少ない。
WindowsとMacで標準なのでデファクトスタンダード。
欠点
元は独自拡張なので世界の統一コードであるISO2022と互換性がない。(ただし韓国と中国にShift_JISと同じ構造のコードがある)
エンコードが複雑。
2バイトの区切りを間違えると文字列の途中から見て読めない。
2バイト目に「\」のコードが出て問題が起こる。
・EUC利点
上記Shift_JISの欠点を全て解決。
Shift_JISの漢字に加え補助漢字数千字が使える。
・欠点
半角カナが使えない(無理に使うと複雑なコードに)。
補助漢字は複雑なコード。
旧JISに互換性がない。
WindowsやMacで使いづらい。
・Unicode利点
文字数が多い。
・UTF-8利点
ASCIIの上位互換。
文字列の途中からでも読める。
・UTF-16利点
基本多言語面のみなら1文字2バイト固定で扱いやすい。
2バイトで扱える文字が最も多い。
・Unicode欠点
さまざまな文字がごちゃまぜに登録されているため、扱いが面倒。
(例: 右から左に書く文字、合成文字、文字方向を変える制御文字、同じ文字に複数のコード)
・UTF-8欠点
1文字あたりのバイト数が不定。
他のコードに比べ1文字あたりのバイト数が多い。
・UTF-16欠点
基本多言語面以外の文字を使おうとするとバイト数不定。
ASCIIに互換性がない。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) 文字コード及びフォントに関する次の記述を読み,適切なものをすべて選べ。 ASCIIとは,英数字だけを 4 2023/01/11 19:10
- C言語・C++・C# S-JIS → JIS コード変換するには 3 2023/02/09 23:55
- Excel(エクセル) Excelの操作方法を教えてください!頭文字2~8文字で特定の値に返す方法 8 2022/07/14 11:26
- PostgreSQL PostgressからMySQL(MariaDB)へ構造を変更する際のTimestamp等について 2 2023/04/04 12:09
- その他(パソコン・スマホ・電化製品) 2つの白丸「〇」の使い分けについて 2 2022/06/07 09:19
- JavaScript フォームが空欄の時にフォームの外をクリックすると、エラーが出るコードを調べています。 1 2023/06/25 11:51
- Visual Basic(VBA) VBA 画面上のカーソルに文字数字を入力するコードを教えて下さい 1 2022/10/30 10:31
- Excel(エクセル) 全角文字「ヴ」の半角文字「ヴ」への変換方法について 3 2022/11/05 12:07
- JavaScript ブックマークレットについて 2 2022/10/09 11:48
- Visual Basic(VBA) 該当セルの値を別ブックのシート名と一緒であればコピーしてほしい 1 2022/11/10 20:12
このQ&Aを見た人はこんなQ&Aも見ています
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
10Mバイトて文字数に すると何...
-
エクセルシート名の制限を変更...
-
ピクセル,dpiから容量(バイト...
-
UTF-8で5~6バイトになる文字コ...
-
COBOLのCOMP形式について
-
char str[256]の256の意味は?
-
SQLで1バイト、2バイト混在...
-
バイナリとBCDコード
-
[VBScript][wsh]byte単位でのデ...
-
バイト列とバイナリ列の違いが...
-
3バイト文字(UTF-8)をprintfで...
-
ビットスワップとバイトスワッ...
-
sedコマンドで全ての2バイト文...
-
64bit対応
-
【VB2005】テキストボックス内...
-
URLは最高何文字まで可能なので...
-
COBOL PICTUREで X,S,Vの意味
-
Javaで日本語1文字のバイト数
-
「1TB」のHDDに日本語は何字入...
-
VBAでShift-JISのURLエンコード
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
10Mバイトて文字数に すると何...
-
UTF-8で5~6バイトになる文字コ...
-
char str[256]の256の意味は?
-
エクセルシート名の制限を変更...
-
COBOLのCOMP形式について
-
「1TB」のHDDに日本語は何字入...
-
バイナリとBCDコード
-
ビットスワップとバイトスワッ...
-
ピクセル,dpiから容量(バイト...
-
バイト列とバイナリ列の違いが...
-
SQLで1バイト、2バイト混在...
-
【VB2005】テキストボックス内...
-
Javaで日本語1文字のバイト数
-
1KBが1024byteな理由
-
3バイト文字(UTF-8)をprintfで...
-
C++ Builderで文字列をバイトに...
-
文字コードの利点・欠点について
-
半角、全角の判別方法
-
機種依存文字をチェックしたい。
-
64bit対応
おすすめ情報