電子書籍の厳選無料作品が豊富!

いつもお世話になります。

UTF-8には4バイト文字がありますが、Shift_JIS(CP932)からUTF-8へ変換する際、
Shift_JISでは2バイトで表わされる文字が、UTF-8では4バイトで表わされてしまう文字はありますでしょうか。

宜しくお願いします。

A 回答 (3件)

字体を気にしたら 7バイト (というか 7オクテット) にできるかな?

    • good
    • 0

もし Shift_JIS-2004 とか x-MS932_0213 を使うのであれば、


4バイト文字あります。

たとえば「
    • good
    • 0

Windows-31j (CP932) は CJK 統合漢字の初期策定時の文字集合なので,


Windows-31j のすべての文字は BMP (基本多言語面) に含まれます。
よって,UTF-8 では最大でも 3 バイトにまでになる文字しかないです。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!