dポイントプレゼントキャンペーン実施中!

プログラマを目指して勉強中のものです。
文字コードに関して調べていて気になって、よくわからないので質問させていただきます。

例えば「あ」をUTF-8で表現すると,「0xE3 0x81 0x82」となる、
と言う説明を見るのですが、これは、ja_JP.UTF-8 と en_US.UTF-8 でも変わらないのでしょうか。

そうすると、UTF-8における、このロケールの意味はどこにあるのでしょうか?
詳しいかた、よろしくお願いします。

A 回答 (2件)

その文字列は 国_地域.文字コード という並びになっています。


で、国_地域 と 文字コード は別に考えます。

前半部分は、表示に使う言語や通貨、時刻の表記等に使います。

ja_JP は 「日本で使われている日本語」
en_US は 「アメリカで使われている英語」

対応しているOSやアプリでは、
ja_JP では日本の慣習に沿った表示をしようとします。
 メニューが日本語になるとか(コピー、貼り付け 等)
 年/月/日(曜日) で表示するとか
en_US ではアメリカの慣習に沿った表示をしようとします。
 メニューが英語になるとか(Copy, Paste 等)
 曜日,月/日/年 で表示するとか

この表示に、文字コードは直接は関係ありません。


後半部分は、文字コードを指定しています。
同じ言語でも複数の文字コード(系)があります。
それらのうち、どの文字コードを使うかを指定します。


UTF-8はUnicodeを基準にした符号化の方法です。
Unicodeは「全ての言語の文字を一つのコードで表現する」ことを目指したものです。
どの言語、地域でも「あ」という「日本語のひらがな」を表示したいときには、同じバイト列「0xE3 0x81 0x82」を使います。
    • good
    • 2
この回答へのお礼

よくわかりました。ありがとうございます。

お礼日時:2019/01/01 10:17

市役所などの自治体が行っているパソコン相談で相談したほうが良いと思います。

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています