「みんな教えて! 選手権!!」開催のお知らせ

https://www.moug.net/tech/exvba/0140028.html

このページにあるようにStrConv関数を使って
UnicodeとSHIFT_JISを相互に変換することができます。
これで得られる結果とchr()、Hex(Asc(""))で得られる結果の違いについて教えてください。

例えば、以下のコードをVBAで実行すると

'Unicode→シフトJIS
gg = StrConv("123あいう", vbFromUnicode)
'結果 "㈱舳??"

'シフトJIS→Unicode
gg2 = StrConv("123あいう", vbUnicode)
'結果 "1 2 3 B0D0F0"

というようになります。

gg = StrConv("あ", vbFromUnicode)
と「あ」だけ変換しても"?"になってしまいます。

なぜシフトJISに変換すると文字化けしてしまうのでしょうか?
Hex(Asc("あ"))
で変換すると
82A0となるのですが、これと全く違うのはなぜでしょうか?

また、Unicodeの方は文字化けこそしなかったのですが
意味の分からない出力になりました。

gg2 = StrConv("あ", vbUnicode)
と変換すると"B0"が得られたので
「あ」はB0に相当することが分かったのですが

https://ja.wikipedia.org/wiki/Unicode%E4%B8%80%E …
「あ」はUnicodeでは3242
http://www.seiai.ed.jp/sys/text/java/shiftjis_ta …
「あ」はシフトJISでは82A0

が割り当てられており、全く異なる値であることが分かります。
一体、このB0というのはどこから来る値なのでしょうか?

質問者からの補足コメント

  • ご回答ありがとうございます。

    StrConvの出力先が文字列ではなく
    バイト型の配列にすれば良かったのですね
    納得しました。

    ご呈示くださったコードでどうしても不明な点があるのですが
    http://officetanaka.net/excel/vba/function/CStr. …
    本来はCStrは、数値を文字列に変換するものです。
    しかし、引数としてUnicodeの配列を入れてやると
    なぜか文字列を返すようです。
    d(0) = &H42
    d(1) = &H30
    s11 = CStr(d())

    一方でシフトジスの配列を入れても?となってうまく文字列を得ることができません。

    d2(0) = &H82
    d2(1) = &HA0
    s12 = CStr(d2())

    検索しても出てこなかったのですが
    CStrにはUnicodeを文字列に変換する機能もあるのでしょうか?

    No.1の回答に寄せられた補足コメントです。 補足日時:2015/10/29 21:26
  • ご回答ありがとうございます。

    自分でもいろいろと試していて、
    特性が大分分かってきました。

    ただ、まだ理解できていないのが以下の二つの現象です。

    No.3の回答に寄せられた補足コメントです。 補足日時:2015/10/30 14:58
  • 引数として文字列を使った場合
    r2() = StrConv("あいうえお", vbFromUnicode)
    シフトJISへの変換は正常に行われるのですが
    r2() = StrConv("あいうえお", vbUnicode)
    Unicodeへ変換すると、なぜか空要素が途中に入ったUnicode配列が出力されます。
    Unicodeの配列をUnicodeに変換しても
    同じように空要素が入ったUnicode配列が出力されます。
    この空要素の入ったUnicode配列をシフトJISへ変換しようとすると
    r2() = StrConv(CStr(r2()), vbFromUnicode)
    なぜかシフトJISではなく元の空要素のない正常なUnicode配列が出力されます。

    空要素の入ったUnicode配列が出力されるのも疑問ですが
    シフトJISへの変換で元に戻せるのは一体どういう仕様なのでしょうか?

      補足日時:2015/10/30 14:59
  • それとあと一つ気になったのが、
    シフトJISの禁則文字を含んだ文字列を
    配列に変換後にもう一度元の文字列に戻した時、変換の仕方で文字化けするものとしないものがあります。
    文字化けしない方法
    (文字列→SHIFT_JIS →Unicode(スペース無し)→文字列)
    r4() = StrConv("あいう\ku予定表", vbFromUnicode)
    r5() = StrConv(CStr(r4()), vbUnicode)
    mozi = CStr(r5())

    文字化けする方法
    (文字列 →Unicode(スペース有り)→Unicode(スペース無し)→文字列)
    r6() = StrConv("あいう\ku予定表", vbUnicode)
    r7() = StrConv(CStr(r5()), vbFromUnicode)
    mozi = CStr(r7())

      補足日時:2015/10/30 14:59
  • ここで謎なのはr5とr7は全く同じ配列なのに
    CStrをかけて文字列に変換すると違う結果が得られることです。

    これは一体なぜなのでしょうか?

      補足日時:2015/10/30 14:59

A 回答 (3件)

こんにちは。



あくまでも、Excelに関してということになりますが、VBE上で変換作業をしてみても、あまり実感が沸かないはずです。Excel97の時に、VBE上は、確かに、Unicodeに変わったはずですが、閲覧できるのは、あくまでも、JISの範囲に限られます。矛盾しているような気もしますが、それで長年続いています。

それと、これらの変換の過程は、添付画像で示すように、UserFormのTextBox でやるのが判りやすいはずです。

>gg = StrConv("あ", vbFromUnicode)
>と「あ」だけ変換しても"?"になってしまいます。|Unicodeは読めない。

それが、VBE上での現象です。

>一体、このB0というのはどこから来る値なのでしょうか?
>gg2 = StrConv("あ", vbUnicode)
>と変換すると"B0"が得られたので
あまり意味はないことですが、"B" =42, "0"=30 の文字コードを変換しているにすぎません。

>chr()、Hex(Asc(" "))で得られる結果の違い
Chr()は、10進の文字コードの代入ですよね。
ASC(文字)で排出するのも、10進です。16進にしても意味ないと思います。

>CStrにはUnicodeを文字列に変換する機能もあるのでしょうか?
ばらばらのコードをつなぎ合わせるようです。
Dim d2(1) As Byte
"あ" ->82A0
d2(0) = &H82
d2(1) = &HA0
s12 = StrConv(CStr(d2()), vbUnicode)

Dim d3(1) As Byte
"あ" ->3042 (Unicode)
d3(0) = &H42
d3(1) = &H30 'VBAでは逆になります(ビッグ・エンディエン)
s13 = CStr(d3())

こんなところでしょうか。
「StrConvの使い方について教えてくだ」の回答画像3
この回答への補足あり
    • good
    • 0

先の例では、Unicode文字リテラルの書き方がわからなかったので、あの様な方法にしました。



> CStrにはUnicodeを文字列に変換する機能もあるのでしょうか?

よくわかりませんが、
文字列の内部表現がUnicodeということなので、ある意味特別扱いなのではないでしょうか?
    • good
    • 0

> gg = StrConv("あ", vbFromUnicode)


> と「あ」だけ変換しても"?"になってしまいます。

ソース上の"あ"は、Unicodeではないのでは?


以下の例では適切に変換されている様です。
Dim d(1) As Byte
Dim r() As Byte
Dim s As String

d(0) = &H42
d(1) = &H30
r() = StrConv(CStr(d()), vbFromUnicode)
For i = 0 To UBound(r)
s = s & "," & Hex(r(i))
Next
MsgBox s ' → 82,A0

s = ""
r() = StrConv("あ", vbUnicode)
For i = 0 To UBound(r)
s = s & "," & Hex(r(i))
Next
MsgBox s ' → 42,00,30,00
この回答への補足あり
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


おすすめ情報