詳しい人求む！

ja_JP.UTF-8 と en_US.UTF-8 などの違いについて

解決済

質問者：samidare01
質問日時：2019/01/01 01:12
回答数：2件

プログラマを目指して勉強中のものです。
文字コードに関して調べていて気になって、よくわからないので質問させていただきます。

例えば「あ」をUTF-8で表現すると，「0xE3 0x81 0x82」となる、
と言う説明を見るのですが、これは、ja_JP.UTF-8 と en_US.UTF-8 でも変わらないのでしょうか。

そうすると、UTF-８における、このロケールの意味はどこにあるのでしょうか？
詳しいかた、よろしくお願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

No.2ベストアンサー

回答者： kmee
回答日時：2019/01/01 02:40

その文字列は国_地域.文字コードという並びになっています。

で、国_地域と文字コードは別に考えます。

前半部分は、表示に使う言語や通貨、時刻の表記等に使います。

ja_JP は「日本で使われている日本語」
en_US は「アメリカで使われている英語」

対応しているOSやアプリでは、
ja_JP では日本の慣習に沿った表示をしようとします。
　メニューが日本語になるとか(コピー、貼り付け等)
　年/月/日(曜日) で表示するとか
en_US ではアメリカの慣習に沿った表示をしようとします。
　メニューが英語になるとか(Copy, Paste 等)
　曜日,月/日/年で表示するとか

この表示に、文字コードは直接は関係ありません。

後半部分は、文字コードを指定しています。
同じ言語でも複数の文字コード(系)があります。
それらのうち、どの文字コードを使うかを指定します。

UTF-8はUnicodeを基準にした符号化の方法です。
Unicodeは「全ての言語の文字を一つのコードで表現する」ことを目指したものです。
どの言語、地域でも「あ」という「日本語のひらがな」を表示したいときには、同じバイト列「0xE3 0x81 0x82」を使います。