こんにちは。
jcode.plのconvertがjis,sjis,euc間の相互変換が
行えるのはわかりました。
しかしながら、その用途がよくわかりません。
日本語にはその3種類の漢字コードがよく使われているのは
なんとなくわかるのですが
それを例えば
&jcode::convert(\$test,'sjis');
というように、sjisにするというのは、どのような場面があって
どのような必要性があってそのようにするのか?
またeucに変換しなければならない場面等、
ネットで調べましたがその点がよくわからないのです。
例えば、Windows環境で生成されたテキストファイルの文字列を読み込んで
Linux環境のPerlで出力しようとする時に、不具合が出るので
日本語は必ずEUCで変換する、など。
(この文章が正しいのかどうか適当です。
このような場面が世の中にはあって、その場合はこうする、というような
例として書きました)
ご存知の方、どうぞよろしくお願いします。
No.1ベストアンサー
- 回答日時:
UNIXの世界は、EUC。
Winodws や Macintoshの世界は、SJIS。
メールの世界は、iso-2022-jp(JIS)。
が、標準的な文字コードです。
文字コードが複数ある理由については、既にある程度ご存知の様ですので、詳しい説明は割愛します。
どうして、標準的なのかは、歴史的由縁がいろいろとあるからで、きっと、文字コードが複数存在する理由を調べる過程で、少なからず触れられていると思います。
CGIやHTMLを、日本語EUC漢字で書いている場合には、jcode.pl(最近は、jcode.pmが標準です)は不要かも知れません。
必要になってくるのは、SJISで書かれた文章をEUCに変換する場合などです。必要な理由ははじめに書いた通り、標準の文字コードが違うためです。
逆に、SJISに変換する必要がでてくる時は、ユーザー用にCSVファイルを作成する。などの用件がでた時などに必要になってきます。
ここに出したものは、あくまで事例に過ぎません。OSの環境などにより、使用する文字コードの標準が異なっているため、どうしても文字コードの変換の必要性はでてきます。
なお、日本語の漢字コードは3種類ではありません。もっともっとたくさんのコード形態があります。単に、有名なものが EUC, SJIS, JIS である。と言うことです。ご注意ください。
なぜ、不具合が発生するのかは、もう調べましたか? もし、まだでしたら、面白いですから調べてみてください。Google などで検索すればいろいろな情報を見ることができますよ。
ご返答ありがとうございます。
詳しい解説、とてもわかりやすいです。
>ここに出したものは、あくまで事例に過ぎません。OSの環境などにより、使用する文字コードの標準が異なっているため、どうしても文字コードの変換の必要性はでてきます。
そうなんです。自分が知りたいのは
そういう色々なケースなんです。
もちろん、全てのケースを列挙できるはずはないと思いますが、
それでも代表的な例・パターンというものが存在するなら
それがどんな形を取ればいいのか教えて頂きたいのです。
もしよろしければ、その部分補足して頂けると
大変助かります。
どうぞよろしくお願い致します。
No.3
- 回答日時:
No.2
- 回答日時:
もっとも有名なケースは、CGIでのデコード処理でしょう。
出来の悪いブラウザの中には、HTMLの文字コードとは異なるコードでフォーム送信してくるものもあります。そういう場合でも正しく処理するためには、コード変換が必要になります。(最近はそういうブラウザも見かけなくなりましたが・・・)
また、シフトJISでスクリプトを書いている場合、きちんと処理しないと様々な場面で不具合が生じるため、問題が起きそうな所では一時的にEUCして処理する、なんて人もいます。
他にも、メール送信スクリプトでは件名や本文をJISに変換する必要があるし、アクセス解析スクリプトではキーワード解析時に文字変換が必要になります。
※検索エンジンがUnicodeである場合、jcode.plだけでは対処できないので、Jcode.pmやEncode.pmが必要です。
ご返答ありがとうございます。
>シフトJISでスクリプトを書いている場合、きちんと処理しないと様々な場面で不具合が生じるため、問題が起きそうな所では一時的にEUCして処理する
なるほど。そういうのがあるんですね。
しかしながら、自分が知りたいのは
おっしゃっているケースの具体的な形なんです。
例えば、この例であげてくださっている
「きちんと処理しないと不具合が生じる」
というのが、
どんなケースがあって、なぜそれが起こるのか、
そしてjcode.plを使うとそれが解決されるまでの
パターンを知りたいのです。
お手数になりますが、もしよろしければ
また補足して貰えますでしょうか。
よろしくお願いします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
関連するカテゴリからQ&Aを探す
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
常用漢字?でない文字を判定す...
-
機種依存文字の文字コード変換
-
InputMan の imTextについて
-
index関数と英語文字
-
CSVファイルの中で、「 , 」カ...
-
エクセルで数値を全角文字(カ...
-
カンマ区切りの数字をCSVフ...
-
英数字のみ全角から半角に変換
-
EXCELからCSVにすると余計なカ...
-
CString から LPCTSTRの型に変換
-
住宅にカナを入力する際に丁目...
-
何故、日本は未だに数字を3桁...
-
WORDで改ページすると時々グレ...
-
「何とかで始まり、何とかで終...
-
Excel VBAでPDFファイルをMicro...
-
正規表現で、特定の文字列を含...
-
文字コードの%E3%80%とは何です...
-
CSVの定義
-
C#で、テキストボックスの入力...
-
VBA 置換文字がみつからない時
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
InputMan の imTextについて
-
文字化けを元に戻せますか?
-
大文字、小文字のコードの打ち方
-
チェックボックスの複数選択の...
-
特殊文字をPOSTした際の動作は?
-
ダブルクォート文字などをフォ...
-
デコード処理について
-
jcode.plについて
-
常用漢字?でない文字を判定す...
-
機種依存文字の文字コード変換
-
formデータのデコード「s///」...
-
index関数と英語文字
-
文字実体参照が勝手に変換され...
-
データが多いとエラーになる:...
-
jcodeを使ったgetcode
-
半角と全角の文字数カウント方法
-
文字をISO Lathin 1 文字コード...
-
文字化けの事で?
-
戻り値の意味がわかりません…
-
CASL2の仕様での英単語の格納方法
おすすめ情報