プロが教える店舗&オフィスのセキュリティ対策術

goo辞書には発音記号が表示されています。
connect の発音記号は「kənékt」
apple の発音記号は「ǽpl」
http://dictionary.goo.ne.jp/leaf/ej3/3823/m0u/ap …

これは、インターネット ブラウザー(=html ブラウザー)では、せいじょうに表示されています。また、Microsoft Word に張り付けても表示できます。

しかし、テキスト エディターに張り付けると、以下のように「?」表示になります。

connect の発音記号は「k?n?kt」
apple の発音記号は「?pl」

これは なぜでしょうか。「特殊な文字を使用しているのだろう」くらいは推測できますが、具体的には何という名前の特殊文字なのでしょうか。これをテキスト エディターに表示させる方法は存在しないのでしょうか。言い換えれば、なぜ html ブラウザーや MS Word では表示できているのでしょうか。インターネットで「特殊文字 ブラウザー テキスト エディター」などで検索しても発見できませんでした。そのため質問させていただきます。よろしくお願いいたします。

具体例:
インターネット ブラウザー:Firefox、Internet Explorer、Opera、Google Chrome
テキスト エディター:秀丸エディタ、メモ帳(notepad.exe)、VxEditor

A 回答 (11件中1~10件)

ANo.1です。


>TeraPad
>オプション > 文字コード
>初期文字コード: UTF-8
>保存文字コード: UTF-8
>というか、だったら、これらの設定は
>いったい何なのでしょうか。
その場合の初期文字コードというのはTeraPadで文書作成する際に初期文字コードをUTF-8にしておくということのはずですし、保存についてもTeraPadで保存する際にデフォルトでUTF-8にするという設定項目ですよね。
今回のような質問の場合、どこかの誰かがどんな文字コードで作成したか判らない文書をどの文字コードで「解釈」するか?という設定を見る必要があるわけで・・・
TeraPadの場合、オプション設定で「文字コード/改行コードを自動認識する」という設定があるようです。このあたりを確認してみてはどうですか?

因みに…
ブラウザはそのWebページがどんなHTML(またはXMLとか)のバージョンと文字コードで作成されているかをヘッダー情報から判断しそれによってソースを解釈して表示させますので、今回の質問で提示されたページならHTML4.01 Transitional で文字コードがUTF-8(charset=utf-8)となっていることを判断し、解釈できるブラウザなら(大抵はそうですが)当然文字化けはしません。
ただテキストエディター側ではブラウザが表示させた結果の文字がどの文字コードで書かれたものかを自動的に判断出来なければ結果として文字化けするということでしょう。

なお、今回のような質問の回答に対するヒントを検索するなら「発音記号 テキストエディター」いったキーワードのほうがヒットしやすいかと思いますよ。

この回答への補足

かいとうをありがとうございます。

>TeraPadの場合、オプション設定で「文字コード/改行コードを自動認識する」という設定があるようです。このあたりを確認してみてはどうですか?

はい、その設定も実行しました。その設定が有効の場合、無効の場合、両方とも試しました。また、考えられる限りの類似設定の全部は実行しました。それでも不可能でした。

>ただテキストエディター側ではブラウザが表示させた結果の文字がどの文字コードで書かれたものかを自動的に判断出来なければ結果として文字化けするということでしょう。

それは、確かに、ヘッダー情報がない限り、そのとおりだと おもいます。言い換えれば、こうなります。

「全部のテキスト エディターは、ヘッダー情報のない全部のコピペは、文字化けする。」

これは現実矛盾です。実際に、メモ帳はコピペだけで文字コードを判別できてしまいます。一方、「本当にコピペした文字情報だけで判断できる」のであれば、ヘッダー情報が完全な冗長情報に なってしまいます。ゆえに、ヘッダーの文字コード情報は世界中から消滅していなければ不自然です。

ということは、これらの矛盾全部を合理的に説明できる手段は1つだけです。「コピペしているときに、ユーザーが気づかないだけで、文字コード情報も Windows OS が こっそりコピペしている」ということでしょう。そう考えなければ不自然です。そして、TeraPad や VxEditor は、それを読み取る能力がない、にもかかわらず、設定には読み取れるかのような状態を維持している。つまり不具合である、と想定されます。この解釈いがいだと、絶対に現実矛盾が発生します。私の認識に間違いがあれば、指摘してください。

補足日時:2014/04/17 23:16
    • good
    • 0
この回答へのお礼

有力な情報が得られないので、これで終了します。回答してくださった皆さん、ありがとうございます。

お礼日時:2014/04/27 17:46

>「コピペしているときに、ユーザーが気づかないだけで、


>文字コード情報も Windows OS が こっそりコピペしている」
>ということでしょう。
そうですね。OS側では文字コード情報もコピーしているはずです。
>TeraPad や VxEditor は、それを読み取る能力がない、
>にもかかわらず、設定には読み取れるかのような状態を
>維持している。つまり不具合である、と想定されます。
提示されたURLのHTMLソースを見れば判りますが、「ǽ」については「ǽ」となっています。
ご存じだと思いますが、Webページ上で発音記号のような特殊文字を表示させるにはその特殊文字に対応したコード表に従って表記するので「ǽ」を表示させるならHTMLのソース上では「ǽ」と表記するわけですよね。
TeraPadをインストールして提示されたURLのHTMLソースを読み込んでみましたがちゃんと「ǽ」として表示されてましたので、文字コード情報を読み込んで表示させていることになるといえるでしょう。
TeraPadや秀丸エディター等はphpやHTMLの編集・作成に用いられる訳で、その際には特殊文字をそのまま表示してしまうと却って不具合なこととなるのを考えているのかもしれません。
このあたりは作者に直接問い合わせてみるのもありかと思います。
「html の文字列をテキスト エディター」の回答画像11
    • good
    • 0

No.6,7,8です。


OS(Windows)自体は、文字コードを読取ると、それをテキストエディタに貼り付けるときにそれを利用します。

※ただ、テキストエディタでフォントの指定をそのキャラクターを持っていないフォントセットにしていると文字を表示することが出来ません。
⓵(晴)✄➀〠¼
これらの文字を、テキストエディタのフォントを拡張していないMSP明朝では表示できない・・

 いまどき、内部処理にUTF-8を使っていないアプリケーションは少ないと思います。
    • good
    • 0

>というか、だったら、これらの設定は いったい何なのでしょうか。


 なんなんでしょうね、--製作者に聞いてみないとわからない。

 どのブラウザでも同じ結果になると言うことは、すくなくともシステム上はちゃんとUNICODEで受け渡しされている。
 それをアプリケーションが受け取る時に、旨くいってない。
    • good
    • 0

他のテキストエディタはわかりませんが・・



ひょっとして新規作成時の初期設定の文字コードがShift_JISになっているのでは??

EmEditorの場合、システムに指定しておけば、unicodeがデフォルトになる。
XP以降のWindowsはUNICODEですから・・
「html の文字列をテキスト エディター」の回答画像7

この回答への補足

かいとうをありがとうございます。

以下の設定に変更後、エディターを再起動して試しましたが、不具合は変化しませんでした。

VxEditor
共通の設定 > 文字コード > 初期文字コード: UTF-8

TeraPad
オプション > 文字コード
初期文字コード: UTF-8
保存文字コード: UTF-8

というか、だったら、これらの設定は いったい何なのでしょうか。

補足日時:2014/04/16 15:58
    • good
    • 0

テキストエディタの問題だと思いますが???


普通にテキストエディタ(EmEditor -- http://jp.emeditor.com/ )に、何の特段の処理しなくても添付図のようにコピーペーストできます。タスクバーのアイコンを左クリックすと貼り付けて起動する。ついで他のテキストもコピーペースト。いずれでも

 ためしに、その文字を選択して、表示メニューから「文字コード表示」でU+01FD も表示されます。

 保存時の文字コードをShift_JISなどに指定すると、「この文字コードでは保存できない文字がある」と指摘されますが・・
「html の文字列をテキスト エディター」の回答画像6

この回答への補足

かいとうをありがとうございます。

やはり不具合はテキスト エディターに依存するのですね。知りたいのは、おもに以下のことです。

・なぜテキスト エディターにより不具合が発生する場合があるのか? 必要最小限の機能しかない「メモ帳」でさえ、せいじょうに貼り付けられるのに、なぜ一部のテキスト エディターは不具合を発生させるのか? メモ帳以下の性能ということか?

・数多く存在するテキスト エディターのうち、どのくらいの割合で、この不具合は発生するのか? 有名なテキスト エディターでさえ、この不具合を発生させているということは、ほとんどで不具合は発生する?

補足日時:2014/04/16 14:51
    • good
    • 0

>文字コードとは無関係に見えます。


>メモ帳に張り付けたところ、確かに文字化け しませんでした。
>しかし、VxEditor、TeraPad だと文字化け しました。
>設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。

貼り付けた後に変更しても意味がありません。
貼り付けた時点でsjisになっています。

Windows 7の標準入出力表示は、厳密には「Windows code page 932(cp932)」です。
ただ、Shift-JISと同じなので普通はShift-JISと言ってますが。

この回答への補足

かいとうをありがとうございます。

貼り付けた後に変更した場合、貼り付ける前に変更する場合、両方とも試しました。そのほか、いろいろと試しましたが全滅です。

補足日時:2014/04/16 12:12
    • good
    • 0

「VxEditor」を例に。


VxEditorのヘルプに、
「VxEditorは内部ではShiftJISで文字列を扱っているため、ShiftJISにない文字は扱えません。」
とあります。
このへんが関係してるのでは?
エディターソフトに依存するってことでしょう。
    • good
    • 0

発音記号の正式名称は


国際音声記号(IPA=International Phonetic Alphabet)です。
今試してみたけれどFirefox→Terapadでも文字化けしやした。

ただwin7の標準メモ帳は読み込めましたね。
unicodeとshiftjisしか読めないのにメモ帳はおkでテキストエディタはNG
という事になると
収録されている文字列に存在しない記号は「?」と表記されているのではないでしょうか?
あくまで憶測ですけれど。

この回答への補足

回答をありがとうございます。

文字コードとは無関係に見えます。私の環境は Windows 7 です。メモ帳に張り付けたところ、確かに文字化け しませんでした。しかし、VxEditor、TeraPad だと文字化け しました。設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。仮に文字コードが関係しているのであれば、ウェブ サイトと同じ UTF-8 に設定したじてんで正しく表示されるはずです。そうでないということは、文字コード以外の何らかの理由に依存していると想定されます。

補足日時:2014/04/16 00:16
    • good
    • 0

回答からは、外れますが、


今、Windows7のメモ帳にコピペしたところ
正しく表示できたので、
おそらくUTF-8ではないかと、推測しています。

お持ちの、テキスト エディター
をUTF-8モードにしてから、貼り付けてみても
ダメですか?

この回答への補足

回答をありがとうございます。

文字コードとは無関係に見えます。私の環境は Windows 7 です。メモ帳に張り付けたところ、確かに文字化け しませんでした。しかし、VxEditor、TeraPad だと文字化け しました。設定で「UTF-8」「EUC」などに変更しても、やはり文字化け しました。仮に文字コードが関係しているのであれば、ウェブ サイトと同じ UTF-8 に設定したじてんで正しく表示されるはずです。そうでないということは、文字コード以外の何らかの理由に依存していると想定されます。

補足日時:2014/04/16 00:16
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!