バイナリデータの取り扱い方法について教えて下さい。 ※PCの環境はWindows7（32bit）、バイナリエディタに「Stirling」を使用しております。あるPDFファイルを、pdftkというツールで解凍した後、中身を見ようとバイナリエディタで開いたのですが、その中に「16進表記で変換できる文字列」と、「変換できない文字列」が混在しているようで困っております。下記のサイトで、16進数→漢字に変換して確認しているのですが、 http://www.scarfboy.com/coding/unicode-tool?s=U%2B65b0 例えば「名前」という漢字2文字だと、 ============================= 「前」は「524D」という値になっているのですが、「名」が「545C72」という値で格納されているようで、上記サイトでも上手く変換できませんでした。「名」の16進表記は本来「524D」だと思うのですが、なぜこのような値になってしまっているのでしょうか。また、「545C72」→「名」と変換できるような良い方法はあるのでしょうか。 ============================ その他にも、おそらく「）」を表している部分が、「FF5C74」という値で格納されたりということが発生しております。いろいろ勘違いがあるかもしれませんが、ご教授お願い致します。

>「名」の16進表記は本来「524D」だと思うのですが、 >なぜこのような値になってしまっているのでしょうか。 540Dですね。で、5C72は”\r”。ということで、変換後のバイナリ(?)が値によっては余計なエスケープが行われているようです。 http://wisdom.sakura.ne.jp/programming/c/Cdata1.html 他にどんなのがエスケープされるか不明ですので、確認は少々キツそうですな。 # ツールのオプションとかで設定できる…かも知れません。 # 無い場合は微妙ですかね……。とりあえず、事例では0x0D=>"\r"、0x09=>"\t"への変換は食らっているようです。

おしえて

バイナリデータの文字列変換（5C問題？）について

解決済

質問者：jshannon9
質問日時：2015/05/08 10:53
回答数：2件

バイナリデータの取り扱い方法について教えて下さい。
※PCの環境はWindows7（32bit）、バイナリエディタに「Stirling」を使用しております。

あるPDFファイルを、pdftkというツールで解凍した後、
中身を見ようとバイナリエディタで開いたのですが、
その中に「16進表記で変換できる文字列」と、「変換できない文字列」が
混在しているようで困っております。

下記のサイトで、16進数→漢字に変換して確認しているのですが、
http://www.scarfboy.com/coding/unicode-tool?s=U% …

例えば「名前」という漢字2文字だと、
=============================
「前」は「524D」という値になっているのですが、
「名」が「545C72」という値で格納されているようで、
上記サイトでも上手く変換できませんでした。

「名」の16進表記は本来「524D」だと思うのですが、
なぜこのような値になってしまっているのでしょうか。

また、「545C72」→「名」と変換できるような
良い方法はあるのでしょうか。
============================

その他にも、おそらく「）」を表している部分が、
「FF5C74」という値で格納されたりということが発生しております。

いろいろ勘違いがあるかもしれませんが、ご教授お願い致します。

> 「名」の16進表記は本来「524D」だと思うのですが、
「540D」の間違いでした。
Wr5さん、ご指摘ありがとうございました。

補足日時：2015/05/08 12:10
通報する
ご回答頂いた方のヒントから自己解決しました。
（汎用的ではないと思いますが、今回のケースはこれで解決としました。）

下記リンクのエスケープシーケンスのうち、
（http://ratan.dyndns.info/MicrosoftVisualC++/eska …）
今回バグ（？）として変換されていたのは次の5つでした。
====================
コード　　文字列（16進表記）
0x08 =>「\b」（5C62）
0x0C =>「\f」（5C66）
0x09 =>「\t」（5C74）
0x0D =>「\r」（5C72）
0x5C =>「\\」（5C5C）
====================

これを変換表として、ファイル中に出てくる値を
「545C72」→「540D」→「名」
「FF5C74」→「FF09」→「）」
として変換することができました。

補足日時：2015/05/08 13:45
通報する

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (2件)

ベストアンサー優先
最新から表示
回答順に表示

うーん・・・

No.1ベストアンサー

回答者： Wr5
回答日時：2015/05/08 11:36

>「名」の16進表記は本来「524D」だと思うのですが、

>なぜこのような値になってしまっているのでしょうか。

540Dですね。で、5C72は”\r”。
ということで、変換後のバイナリ(?)が値によっては余計なエスケープが行われているようです。
http://wisdom.sakura.ne.jp/programming/c/Cdata1. …

他にどんなのがエスケープされるか不明ですので、確認は少々キツそうですな。
# ツールのオプションとかで設定できる…かも知れません。
# 無い場合は微妙ですかね……。
とりあえず、事例では0x0D=>"\r"、0x09=>"\t"への変換は食らっているようです。