プロが教える店舗&オフィスのセキュリティ対策術

URLのエンコードで日本語は16進数に変換されると学びましたが、16進数とひらがなや漢字が対応してるってことですか?

1Fは「ろ」とか?

A 回答 (4件)

URL だのなんだのは関係なく, コンピュータの内部では全てが「数字」で表される. もちろん数字のままだと人間とのやりとりに不便なので,


・人間から与えられた情報をしかるべき方法によって数字に変換する
・人間に提示する情報はしかるべき方法で数字から「それなりなもの」に変換する
ということもコンピュータ (プログラム) に組み込んである.

この流れは文字においても同様で, 文字 (や文字列) においては特別に「しかるべき方法」を「エンコーディング」と呼ぶことがある. だから, コンピュータで扱うことのできる「文字」はなんらかのエンコーディングによって必ず「数字」になる. コンピュータ内部では原則として 2進数を使うので「2進数 (ないし 8進数または 16進数) に変換される」といってもいいけど, そこは本質じゃない.

あたりまえだが「エンコーディング」は統一していないとまともな情報のやりとりができなくなる. そして現在では非常に残念なエンコーディングである Unicode (のうちの UTF-8) が使われているのだ....
    • good
    • 0

URLエンコードは%区切りの16進数です。



例えば、「ろ」は「%E3%82%8D」です。

あいうえお かきくけこは以下のようになります。
あ %E3%81%82
い %E3%81%84
う %E3%81%86
え %E3%81%88
お %E3%81%8A

か %E3%81%8B
き %E3%81%8D
く %E3%81%8F
け %E3%81%91
こ %E3%81%93

例えばウィキペディアの「エンコード」は以下のようなURLとなります。
https://ja.wikipedia.org/wiki/%E3%82%A8%E3%83%B3%E3%82%B3%E3%83%BC%E3%83%89
※上のURLは頭の「h」を全角にして、リンクが貼られないようにしています。

このURLの「%E3%82%A8%E3%83%B3%E3%82%B3%E3%83%BC%E3%83%89」の部分が「エンコード」を表します。

一文字づつに分けると
エ %E3%82%A8
ン %E3%83%B3
コ %E3%82%B3
ー %E3%83%BC
ド %E3%83%89
です。
    • good
    • 0

そういうことです。



日本語に限らず、文字には対応する16進数があります。
正確に言うと2進数(バイナリ)ですが、細かいことはまあいいでしょう。

https://seiai.ed.jp/sys/text/java/utf8table.html
    • good
    • 0

>1Fは「ろ」とか?



これなら1バイトです、16進2バイトなら A31F ←こんな感じ4bit x 4
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!