
とても基本的な事かもしれませんが、文字セットをUTF-8に設定すると、ソースに日本語を使うと画面には?????と表示されますが、UTF-8の設定でも、以下の様な記述をすると、日本語が表示されています。
<meta charset=utf-8..........
・
・
<div class="editsection" style="float:right;margin-left:5px;">[<a href="/index.php?title=Nakagawa_Shoko&action=edit&section=1"
title="Nakagawa Shoko">edit</a>]</div>
<a name="Profile"></a><h2> Profile </h2>
<ul><li><b>Name:</b> 荳ュ蟾晉ソ泌ュ・
</li><li><b>Name (romaji):</b> Nakagawa Shoko
ちなみに「 荳ュ蟾晉ソ泌ュ・」この部分はweb上では、「中川翔子」となりますが、一体この記述方法は何なのでしょうか?何故、「 荳ュ蟾晉ソ泌ュ・」が中川翔子となるのか全く分かりません。
教えてgooもやはり日本語部分が、半角カタカナになってますが、どうすればこんな記述が可能なのでしょうか?
どうすれば、UTF-8で日本語表示が可能になるのか教えて下さい。
文字変換ソフトとかあるのでしょうか?
また初心者に参考になるサイトがありましたら教えて下さい。
ちなみにホームページ作成ソフトは持っていません。
No.2ベストアンサー
- 回答日時:
「UTF-8で」ということはソースの文字コードがUTF-8でないといけないのですが・・。
エディタなどで文字コードをUTF-8に変えて保存すればいいと思います。参考URLのsakuraなどがお勧めですかねぇ・・。参考URL:http://members.at.infoseek.co.jp/sakura_editor/s …
返答が遅れて大変申し訳ありませんでした。
色々四方八方探索した結果、ベクターのサイトでTeraPadなるフリーソフトを見つけました。これを使うとutf-8の設定のサイトをメモ帳で開くと「荳ュ蟾晉ソ泌ュ・」こんなような記述のソースが、見事に日本語で表示されました。
メモ帳とかワードパッド以外と言われても、分からないまま途方に暮れていましたが、やっと「sakura」の意味が理解できて、TeraPadを使うようになって、問題は解決しました。
ありがとうございました。
No.4
- 回答日時:
文字セットをUTF-8に設定すると、漢字は「すべてUTF-8でコード化」されます。
UTF-8でコード化された「中川翔子」は、16進数の文字コードで
E4 B8 AD E5 B7 9D E7 BF 94 E5 AD 90
になります。
1文字づつ書けば
E4 B8 AD 中
E5 B7 9D 川
E7 BF 94 翔
E5 AD 90 子
です。
このソースを「漢字は、シフトJISの筈」と思ってるメモ帖などで開くと
E4 B8 AD E5 B7 9D E7 BF 94 E5 AD 90
は、シフトJISコードだと勘違いされ
E4 B8 荳
AD ュ(半角カタカナ)
E5 B7 蟾
9D E7 晉
BF ソ(半角カタカナ)
94 E5 泌
AD ュ(半角カタカナ)
90 ?? ・(90は2バイト文字の1つ目だが、2つ目が無くいので「・」になる)
と解釈され、メモ帳の画面には
荳ュ蟾晉ソ泌ュ・
と表示されます。
なので、このソースを開く(表示する)には、
「漢字がUTF-8になってる部分を、シフトJISに直してくれる変換ツールで変換してから、漢字はシフトJISの筈だと思って動くメモ帖で開く」
か、または
「漢字はUTF-8の筈だと思って動く、メモ帖以外のソフトで開く」
のどちらかの方法を取ります。
以下の2つのURLは、googleの検索URLです。
http://www.google.co.jp/search?q=%E4%B8%AD%E5%B7 …
http://www.google.co.jp/search?q=%E4%B8%AD%E5%B7 …
どちらも、検索文字列は「%E4%B8%AD%E5%B7%9D%E7%BF%94%E5%AD%90」であり、ある文字列を「16進コード」で指定してあります。
しかし、表示される結果は、前者は「荳ュ蟾晉ソ泌ュ・」が検索されるのに対し、後者は「中川翔子」が検索されます。
なぜ同じ文字列が指定されてるのに結果が違うかと言うと、URLの末尾の漢字コードの指定が異なるからです。
URLを良く見ると、前者は「ie=Shift-Jis」と、後者は「ie=utf-8」というように「漢字コードが何のコードでコード化してあるかの指定が異なっている」のです。
つまり「同じ文字の並びでも、コードに与える意味が変われば、表示も意味も変わってしまう」のです。
逆に言えば「本来の意味と違う意味に解釈して表示しちゃうと、文字が別の物に化ける」のです。これを「文字化け」と言います。
この回答への補足
なるほど。丁寧に説明していただき、ようやく仕組みが理解出来ました。
そこで再度質問なんですが、
>「漢字がUTF-8になってる部分を、シフトJISに直してくれる変換ツールで変換してから、漢字はシフトJISの筈だと思って動くメモ帖で開く」
>か、または
>「漢字はUTF-8の筈だと思って動く、メモ帖以外のソフトで開く」
変換ツールと言うのは、#2の方が言われているsakuraの事でしょうか?
また「メモ帳」以外のソフトと言うのは具体的に何ですか?
初歩的でほんとにすいません。
よろしくお願いします。
No.3
- 回答日時:
> 荳ュ蟾晉ソ泌ュ・」
UTF-8 の "中川翔子" を無理やりShiftJISで書かれたものとして
みるとこんな結果になります。
どのような手段でみましたか?
メモ帳で開いたとか、コマンドプロンプトでtypeしたとか。
この回答への補足
ここに表記したサイトはMediaWikiという英文のサイトですが、
ソースをメモ帳で開いて見ると、UTF-8の設定で、日本語の部分が「荳ュ蟾晉ソ泌ュ・」に表示されたので、metaタグでUTF-8に設定しても、日本語が表示出来る方法があるのかな・・・と思いまして。
今まではどうしても日本語が必要な時は、gif画像にして貼り付けていました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
Excel VBA 見本通りに...
-
カラムの末尾にスペースが入る
-
XMLを作成してもタグしか表示さ...
-
Windowsのformでtextareaに入力...
-
AfterEffectsでイージーイーズ...
-
AIRを使ってブラウザ上でWEBサ...
-
Mayaレンダリングの中断
-
<IMG>のALIGN属性値「absmiddle...
-
htmlで文字列をクリップボード...
-
Python 3.12.2 か一番最新のパ...
-
_blank?_brank?
-
MMDのAVI出力にとんでもなく時...
-
Dell製品のサービスタグについて
-
ホームページで、クリックする...
-
span要素にのみwhite-space: no...
-
<br style="clear:both;">って...
-
HP、リンク先を最大化で開く方...
-
H1タグに改行の<br>を使う
-
複数のgifアニメをレイヤーで重...
-
下着などの洗濯タグ、どうやっ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
Excel VBA 見本通りに...
-
JSONパース時に改行があるとエ...
-
C#のシリアル通信プログラムで...
-
JavascriptでIMEのON,OFF制御
-
ASCII文字列以外を検出する正規...
-
stray '\\240' in programのエ...
-
ASP.NET TextBox 入力制限
-
半角スペースを含む文字列を変...
-
氏名の入力チェックに全角スペ...
-
なぜtabによるインデントはいけ...
-
ホームページ制作でコピーライ...
-
(再投稿) Word VBA マクロ スペ...
-
ローマ数字などの文字化け対策...
-
Eclipseの空白が変な...
-
入力されたテキストが、全角か...
-
教えてください
-
ボタンコントロールのTEXT...
-
ソースコードのインデントについて
-
ソースコードの改行文字は何に...
-
インデントのEBNFについて
おすすめ情報