重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

【GOLF me!】初月無料お試し

とても基本的な事かもしれませんが、文字セットをUTF-8に設定すると、ソースに日本語を使うと画面には?????と表示されますが、UTF-8の設定でも、以下の様な記述をすると、日本語が表示されています。

<meta charset=utf-8..........


<div class="editsection" style="float:right;margin-left:5px;">[<a href="/index.php?title=Nakagawa_Shoko&amp;action=edit&amp;section=1"
title="Nakagawa Shoko">edit</a>]</div>
<a name="Profile"></a><h2> Profile </h2>
<ul><li><b>Name:</b> 荳ュ蟾晉ソ泌ュ・
</li><li><b>Name (romaji):</b> Nakagawa Shoko

ちなみに「 荳ュ蟾晉ソ泌ュ・」この部分はweb上では、「中川翔子」となりますが、一体この記述方法は何なのでしょうか?何故、「 荳ュ蟾晉ソ泌ュ・」が中川翔子となるのか全く分かりません。
教えてgooもやはり日本語部分が、半角カタカナになってますが、どうすればこんな記述が可能なのでしょうか?

どうすれば、UTF-8で日本語表示が可能になるのか教えて下さい。
文字変換ソフトとかあるのでしょうか?
また初心者に参考になるサイトがありましたら教えて下さい。
ちなみにホームページ作成ソフトは持っていません。

A 回答 (4件)

「UTF-8で」ということはソースの文字コードがUTF-8でないといけないのですが・・。

エディタなどで文字コードをUTF-8に変えて保存すればいいと思います。参考URLのsakuraなどがお勧めですかねぇ・・。

参考URL:http://members.at.infoseek.co.jp/sakura_editor/s …
    • good
    • 0
この回答へのお礼

返答が遅れて大変申し訳ありませんでした。
色々四方八方探索した結果、ベクターのサイトでTeraPadなるフリーソフトを見つけました。これを使うとutf-8の設定のサイトをメモ帳で開くと「荳ュ蟾晉ソ泌ュ・」こんなような記述のソースが、見事に日本語で表示されました。
メモ帳とかワードパッド以外と言われても、分からないまま途方に暮れていましたが、やっと「sakura」の意味が理解できて、TeraPadを使うようになって、問題は解決しました。
ありがとうございました。

お礼日時:2008/03/13 17:36

文字セットをUTF-8に設定すると、漢字は「すべてUTF-8でコード化」されます。



UTF-8でコード化された「中川翔子」は、16進数の文字コードで
E4 B8 AD E5 B7 9D E7 BF 94 E5 AD 90
になります。

1文字づつ書けば
E4 B8 AD 中
E5 B7 9D 川
E7 BF 94 翔
E5 AD 90 子
です。

このソースを「漢字は、シフトJISの筈」と思ってるメモ帖などで開くと
E4 B8 AD E5 B7 9D E7 BF 94 E5 AD 90
は、シフトJISコードだと勘違いされ
E4 B8 荳
AD   ュ(半角カタカナ)
E5 B7 蟾
9D E7 晉
BF   ソ(半角カタカナ)
94 E5 泌
AD   ュ(半角カタカナ)
90 ?? ・(90は2バイト文字の1つ目だが、2つ目が無くいので「・」になる)
と解釈され、メモ帳の画面には
荳ュ蟾晉ソ泌ュ・
と表示されます。

なので、このソースを開く(表示する)には、
「漢字がUTF-8になってる部分を、シフトJISに直してくれる変換ツールで変換してから、漢字はシフトJISの筈だと思って動くメモ帖で開く」
か、または
「漢字はUTF-8の筈だと思って動く、メモ帖以外のソフトで開く」
のどちらかの方法を取ります。

以下の2つのURLは、googleの検索URLです。
http://www.google.co.jp/search?q=%E4%B8%AD%E5%B7 …
http://www.google.co.jp/search?q=%E4%B8%AD%E5%B7 …

どちらも、検索文字列は「%E4%B8%AD%E5%B7%9D%E7%BF%94%E5%AD%90」であり、ある文字列を「16進コード」で指定してあります。

しかし、表示される結果は、前者は「荳ュ蟾晉ソ泌ュ・」が検索されるのに対し、後者は「中川翔子」が検索されます。

なぜ同じ文字列が指定されてるのに結果が違うかと言うと、URLの末尾の漢字コードの指定が異なるからです。

URLを良く見ると、前者は「ie=Shift-Jis」と、後者は「ie=utf-8」というように「漢字コードが何のコードでコード化してあるかの指定が異なっている」のです。

つまり「同じ文字の並びでも、コードに与える意味が変われば、表示も意味も変わってしまう」のです。

逆に言えば「本来の意味と違う意味に解釈して表示しちゃうと、文字が別の物に化ける」のです。これを「文字化け」と言います。

この回答への補足

なるほど。丁寧に説明していただき、ようやく仕組みが理解出来ました。

そこで再度質問なんですが、
>「漢字がUTF-8になってる部分を、シフトJISに直してくれる変換ツールで変換してから、漢字はシフトJISの筈だと思って動くメモ帖で開く」
>か、または
>「漢字はUTF-8の筈だと思って動く、メモ帖以外のソフトで開く」

変換ツールと言うのは、#2の方が言われているsakuraの事でしょうか?
また「メモ帳」以外のソフトと言うのは具体的に何ですか?
初歩的でほんとにすいません。
よろしくお願いします。

補足日時:2008/01/22 22:14
    • good
    • 0

> 荳ュ蟾晉ソ泌ュ・」



UTF-8 の "中川翔子" を無理やりShiftJISで書かれたものとして
みるとこんな結果になります。

どのような手段でみましたか?
メモ帳で開いたとか、コマンドプロンプトでtypeしたとか。

この回答への補足

ここに表記したサイトはMediaWikiという英文のサイトですが、
ソースをメモ帳で開いて見ると、UTF-8の設定で、日本語の部分が「荳ュ蟾晉ソ泌ュ・」に表示されたので、metaタグでUTF-8に設定しても、日本語が表示出来る方法があるのかな・・・と思いまして。
今まではどうしても日本語が必要な時は、gif画像にして貼り付けていました。

補足日時:2008/01/22 20:07
    • good
    • 0

ああ、それ


ソースの表示自体はUTFじゃ ないんだよ。
多分Shift_JISかISO-2022JPじゃないかな。

もしそれを見ているのがメモ帳とかだとしたらEUC-JPかもしれないね。
メモ帳ではそういう文字セットには対応してないからそうなるよ。

この回答への補足

自分のホームページを作る際にはメモ帳でソースを書いています。
metaタグのみ日本語で書いて、他は英文と画像を使用しています。
他のサイトを見るときは、メモ帳か、ワードパットですが、日本語の部分が判別不能です。

補足日時:2008/01/22 20:01
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!