
UTF-8の文字コードをUnicode(コードポイント)へ変換させたいのですが、参考URLの情報のように計算式を知りたいです
。
例えば下の「あ」は、16進では「E38182」、10進では「14909826」ですが、どちらかの値を利用してUnicodeのポイントコード「12354」を計算式を用いて求めたいです。
「あ」
Unicode = 12354
16進 = E38182
10進 = 14909826
参考
http://questionbox.jp.msn.com/qa500194.html
No.2ベストアンサー
- 回答日時:
どこまでを「通常」と言っていいのでしょうか?
いわゆる四則演算で求めるのは
「割り算。小数以下切り捨て」
「割り算の余り」
が必要になります。
0xE3 ÷ 0x10 = 0xE 余り 0x03 → この余りが 図中の4bit yyyy に相当
→ これが15~12位に収まるので 0x03 * 2^12
0x81 ÷ 0x40 = 0x2 余り 0x01 → この余りが 図中の6bit yxxxxx に相当
→ これが11~6位に収まるので 0x02 * 2^6
0x82 ÷ 0x40 = 0x2 余り 0x02 → この余りが 図中の6bit xxxxxx に相当
→ これが5~0位に収まるので 0x01 * 2^0
全部合計したものが、Unicodeポイント
また、値によって場合分けが必要です。
バイト長が一定では無いからです。
参考URLにあるものは、Unicodeを10進で表記したか、16進で表記したかの違いなので、単純な式で書けるだけです。
3バイト文字はkmeeさんの計算式どおり出来ました。
1. 0xE3 ÷ 0x10 = 0xE 余り 0x03 * 2^12 ---> 12288
2. 0x81 ÷ 0x40 = 0x2 余り 0x01 * 2^6 ---> 64
3. 0x82 ÷ 0x40 = 0x2 余り 0x02 ---> 2
12288 + 64 + 2 = 12354
2バイト文字は、2.3.を求めることで出すことができました。
大変ありがとうございました。
No.1
- 回答日時:
E38182 ではなく、 E3,81,82と、1バイト目、2バイト目... と考えた方がいいと思う。
全部まとめて10進数にしても、結局8ビット毎に分けて計算する必要があるので無意味。
この回答への補足
>E38182 ではなく、 E3,81,82と、1バイト目、2バイト目... と考えた方がいいと思う。
はい。
その考え方で通常の足し算や掛け算の計算式でUnicodeのコードポイントを割り出すことはできますでしょうか?
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Windows 8 win8 "ベータ ワールドワイド言語サポートで Unicode UTF-8 を使用"を出したい 2 2023/05/23 19:57
- Excel(エクセル) 【マクロ】PasteSpecialメソッドにて、コードが動かない理由が分かりません 2 2023/08/15 20:47
- Ruby パイソンでテキストファイルが読み込めない 1 2022/11/14 16:42
- Windows 8 メモ帳による文字コード変換 2 2022/09/01 18:38
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- Excel(エクセル) excel 行でソートすると計算式が上手くいかない。 6 2022/06/01 08:18
- その他(プログラミング・Web制作) iMacのターミナルにユニコード文字を出す方法 2 2022/06/22 21:48
- その他(法律) PayPayポイントについてです とあるポイントアプリのバンドル名を変えて、新規登録の判定にさせ、招 2 2023/06/17 17:45
- JavaScript 2段階プルダウンで1段階目の選択を終えた後に選択ボックスを見えなくしたい 2 2022/07/05 21:58
- Java java 入力された文字列を数値に置き換えて整数にし、計算をしたいです。 <を10として /を1とし 4 2022/05/16 21:08
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
2進数の足し算(C言語)
-
c languageで 簡単な質問があ...
-
”/”を使わずに割り算したいんで...
-
VB.net Double と...
-
有効数字について 以前質問をし...
-
三菱シーケンサ(Aシリーズ)で...
-
EXCELの関数"STDEV(標準偏差)"...
-
浮動小数点演算を固定小数点演...
-
ExcelでPC(パソコン)によって...
-
CRCの計算方法について
-
計算の丸め誤差の解消について
-
C言語 型変換のタイミング
-
除算を使わずに10で割りたい。
-
色の判定
-
VB6.0での小数点の扱いについて
-
ExcelのINT関数の計算結果がお...
-
大きすぎる数値になるとE+にな...
-
floatの有効桁数
-
floatの有効桁数がわからない
-
PICで小数点の演算
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
ExcelでPC(パソコン)によって...
-
O(n log n)について2
-
有効数字について 以前質問をし...
-
c languageで 簡単な質問があ...
-
ExcelのINT関数の計算結果がお...
-
EXCELの関数"STDEV(標準偏差)"...
-
三菱シーケンサ(Aシリーズ)で...
-
VB.net Double と...
-
計算の丸め誤差の解消について
-
除算を使わずに10で割りたい。
-
2進数の足し算(C言語)
-
16進数 加算 減算 C言語
-
”/”を使わずに割り算したいんで...
-
CRCの計算方法について
-
VB6.0での小数点の扱いについて
-
VBAでミリ秒まで出力する方法
-
時刻の比較
-
2進数データのビット演算
-
教えて小数点の比較!(C言語)
-
C言語 型変換のタイミング
おすすめ情報