No.3ベストアンサー
- 回答日時:
「&#~;」という表現形式は、「数値文字参照」や「文字参照」と呼ばれ、
HTMLやXML内で使用される文字表現方法です。
(参考)
http://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97% …
例えば、楽は、16進数に変換すると楽になります。
この「697d」が文字コード部分ですが、特定の文字コードが使用されている
わけではありません。SJISだったりUTF-16だったりいろいろあり、
使用される文字コードは、どこか別の場所に書かれています。
ただ、SJISやEUCは、たいてい0x8000以上の文字コードが使用される
ようになっており、「697d」といった0x8000以下の文字コードを
使用しているのはUTF-16(Unicode)であると推測できます。
それで、
http://ja.wikipedia.org/wiki/Unicode%E4%B8%80%E8 …
から「697d」の文字を調べると「楽」という感じであることがわかります。
同様の方法で「し」を調べると、ひらがなの「し」であることが
わかります。
その「&#~;」で書かれているデータを「.htm」の拡張子を持つファイル名
で保存して、ブラウザで開けば、結構読めたりします。
ありがとうございます。おかげさまで10進数だということがわかりました。これがわかれば変換も出来そうです。でもバイナリ文字のxmlファイルでもデーターを取得できたので、今は必要なくなりました。
No.2
- 回答日時:
このページで検索してみてください。
http://shimapucchi.blog93.fc2.com/?mode=m&no=261
それと、あなた、至る所で同じ質問をしてませんか?
それってルール違反ですよ。
ご回答有難うございます。貴方が確信をもってそのように思われたのでルール違反だと言われているのでしょうけど、私は未だかつて同様の質問を他でしたことはないのです。どこかで同じような質問を私がしていましたでしょうか?
No.1
- 回答日時:
ご回答ありがとうございます。すみません、質問の仕方が悪かったです。変換したいのは、perlを使って変換して、変換語の文字をファイルに保存したいと思っています。あと、読み込み元のファイルはRSSでした。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Ruby 1、Rstudioで回帰直線を求めるために必要な関数はなにか?アルファベット2文字で答えよ。 2、r 1 2022/08/03 11:38
- C言語・C++・C# S-JIS → JIS コード変換するには 3 2023/02/09 23:55
- JavaScript フォームが空欄の時にフォームの外をクリックすると、エラーが出るコードを調べています。 1 2023/06/25 11:51
- Access(アクセス) Accessのテキストボックスの入力文字制限 1 2023/01/18 20:43
- その他(プログラミング・Web制作) 文字コード及びフォントに関する次の記述を読み,適切なものをすべて選べ。 ASCIIとは,英数字だけを 4 2023/01/11 19:10
- Visual Basic(VBA) 特定の文字を簡単な操作で半角スペースに変換するか削除したい 2 2022/11/01 10:35
- Excel(エクセル) Excelの操作方法を教えてください!頭文字2~8文字で特定の値に返す方法 8 2022/07/14 11:26
- Excel(エクセル) 全角文字「ヴ」の半角文字「ヴ」への変換方法について 3 2022/11/05 12:07
- Excel(エクセル) エクセルの数式で教えてください。 2 2023/03/09 16:55
- Visual Basic(VBA) VBA B列にある前から10文字のみ表示 3 2023/08/07 11:24
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
pythonエラー
-
「繝・せ繝・」となる文字化け
-
Perl:ファイル名だけ文字化けする
-
文字コードについて
-
CSVファイルの中で、「 , 」カ...
-
マクロを使ってフォルダー内に...
-
英数字のみ全角から半角に変換
-
「何とかで始まり、何とかで終...
-
エクセルで数値を全角文字(カ...
-
EXCELからCSVにすると余計なカ...
-
エクセルにMicrosoft Barcode C...
-
カンマ区切りの数字をCSVフ...
-
各項目がダブルクォーテーショ...
-
Excel VBAでPDFファイルをMicro...
-
住宅にカナを入力する際に丁目...
-
csvデータ ダブルクォーテ...
-
CSVの定義
-
正規表現で、特定の文字列を含...
-
IEからEdgeへの移行に伴うIMEの...
-
VBA 置換文字がみつからない時
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
pythonエラー
-
Perl:ファイル名だけ文字化けする
-
IMAP4でsubjectが検索ヒットしない
-
URLエンコードされたデータを戻...
-
1つのサイトで文字コードが混在...
-
perlの日本語文字コードはどう...
-
テキストファイルから日本語部...
-
メール(iso-2022-jp-2)のデコ...
-
jisコードで16進数の『3c』か...
-
「繝・せ繝・」となる文字化け
-
Encodeモジュールで日本語化したい
-
jcode.pmでconvertできない
-
quoted-printableのアルゴリズム
-
Encode.pmで文字コードの判別
-
CASLIIの数値データ入出力
-
BASP21によるbase64のデコード...
-
Perlでのメール本文の解析について
-
PerlでJavaScriptを作成してい...
-
CSVファイルの中で、「 , 」カ...
-
何故、日本は未だに数字を3桁...
おすすめ情報