特殊記号が勝手にエスケープされてしまう

Question

Windows2000 ServerにおいてVBScriptとMicrosoft.XMLDOMを用いてASPスクリプトを作成しています。

XMLで特殊文字<,>,",',&を扱う際には<,>,",'に置換しなくてはならない事はわかったんですが、
実際にReplaceすると例えば<が&lt;になってしまいます。
置換する順番を変えてもこうなるのでおかしいと重い、&への置換を止めてもです。
しかもこれは読み出すと何事も無かったかのように&lt;が<へと戻っています。

試しに置換を全く行わない状態で
「テスト&'>"」という文字列を保存してみると、
保存先ファイルの中では「テスト&'>"」という状態になっていました。

恐らく&,<,>,"が勝手に置換され、読み出される時には元に戻す処理が行われていると思うんですが、これがどの部分で行われているのかがよくわかりません。
JavaScriptで読み出した際にも同様に復元されていたようなので、MSXMLの仕様なのかなと思うんですが、それを裏付ける資料を見つける事もできませんでした。

XMLにおける特殊記号の扱いについて書いているサイトにも記述が見つからなかったので、もしかしたら凄く基本的な事だったりおかしな質問だったりするのかもしれませんが、ご存知の方がいらっしゃいましたら是非ご教授願いたいです。
参考URLだけでも良いですのでどうかよろしくお願いします。

BLUEPIXY · Accepted Answer

#2>node.attributes.item(0).nodeValue = "test>"

node.attributes.item(0).nodeValue = "test<"
の間違いですね

＞MSXMLの仕様なのかなと
ＭＳＸＭＬのリファレンスで

According to the W3C DOM specification, an XML parser can completely expand entity references into entities before the structure model is passed to the DOM. When these entity references are expanded, the document tree does not contain any entity references.

When Microsoft® XML Core Services (MSXML) validates the XML document, it expands external entities (except binary entities). The nodes representing the expanded entity are available as read-only children of the entity reference. The Microsoft implementation does not expand these entities when it is not validating.

とあるので、仕様かと思います。
（英語力が低いので、何ですが、W3C DOM の求めるところで、ＸＭＬパーサーは、ＤＯＭに変換するにあたってエンティティの展開をするべきということかな？、なんにしても、ＸＭＬパーサーとしては、変換するか、エラーにするかしないといけませんが、エラーにしてたら使い勝手の悪いものになると思います。）
ちなみに、
xmlDoc.createEntityReference("lt")
のようにして<エンティティを作成できます。

BLUEPIXY · Answer

どんなデータをどんなスクリプトでどう処理しているか
補足していただけますか

BLUEPIXY · Answer

node.attributes.item(0).nodeValue = "test>"
でいいということだと思いますが

kztk · Answer

何のためにエスケープしているのかを考えれば、わかりやすいかと。

&<>"'などをエスケープしなければならないのはそのXMLを文字列として表現するときの話です。そうしないと、タグなのか単なる文字なのか識別できません。
しかし、DOMドキュメントオブジェクトを扱うときには<?xml・・・という「文字列」ではなくて、もっと抽象的なツリー構造を操作しているのですから、気にしなくてもよい話です。

もちろん逆に
<elem>&</elem>
のようなXMLファイルも、DOMのAPIで操作すればそのまま「&」という値が取得できます。

特殊記号が勝手にエスケープされてしまう

どんなデータをどんなスクリプトでどう処理しているか

この回答への補足

node.attributes.item(0).nodeValue = "test>"

#2>node.attributes.item(0).nodeValue = "test>"

何のためにエスケープしているのかを考えれば、わかりやすいかと。

似たような質問が見つかりました

このQ&Aを見た人はこんなQ&Aも見ています

関連するカテゴリからQ&Aを探す

このQ&Aを見た人がよく見るQ&A

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング