お世話になります。
perl5.8において文字コードを指定or変換する際
shift_jis
shift-jis
Shift_JIS
SJIS
EUC_JP
EUC-JP
utf-8
utf8
-と_の違いや大文字小文字の違いなど記述の違いを良く見かけるのですが、実際決まった指定方法などはあるのでしょうか。
逆に文字コードを指定する際、●●のように指定しても無効で●●のように指定しないと有効ではないですよ。。みたいな。
またperlに限らずPHPやHTML、XMLなどではどうなっているのでしょうか
どなたかご存知の方いましたら
・上記3つの文字コードについてと
・perlのバージョンの違い、言語の違いなど
文字コードの文字列の指定に関する全般についてご教授願えませんでしょか。
宜しくお願い致します。
No.2ベストアンサー
- 回答日時:
文字コードを指定するモジュールによって、指定する文字列が違う場合があります。
たとえば、JcodeでシフトJISコードを指定するときはは'sjis'ですが、
Encodeでは次のような正規表現になります。
/\bshift.*jis$/i
/\bsjis$/i
これは、shift-jisでもShift_jisでもsjisでもSJISでもマッチします。
極端な話、shift(・∀・)jisでもマッチします(多分)
他の文字コードでも同様に正規表現でエイリアスが設定されていますので、詳しくはEncodeモジュールのperldocを参考にしてください。
モジュール毎に文字コードの文字列の指定を正規表現で指定してあるんでしょうかね。確認してみます。
ご教授頂きありがとうございました。
No.1
- 回答日時:
適当に検索かけて見つけただけなので自信ないですが
CHARACTER SETS
http://www.iana.org/assignments/character-sets
というのがありました。検索かけるとわかりますが
Shift_JISはあってもShift-JISは存在しません
EUC-JPはあってもEUC_JPは存在しません
大文字小文字の区別は多分無いと思います。
根拠はありませんがそういう話を聞いたことが無いので・・・
この回答への補足
お返事大変遅くなりましたが、上記URLを参考にさせて頂きました。
とりあえず、EUC_JPは存在しない事とモジュールを呼び出す際
エラーになったケースもあり、エラーにならない場合=OKという
あいまいな認識ですが、とりあえずよしとしておこうと思います。
参考URLもご掲示頂きありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- PHP phpのメールフォームの完了画面でメール受信のコードを書いています。 1 2023/05/31 11:39
- Excel(エクセル) エクセルのVBAについて とあるサイトのコードを参考に、CSVの文字化けを直すVBAを作成しているの 7 2022/11/04 14:15
- その他(プログラミング・Web制作) 文字コード及びフォントに関する次の記述を読み,適切なものをすべて選べ。 ASCIIとは,英数字だけを 4 2023/01/11 19:10
- Visual Basic(VBA) ファイル名の右側を変更したい ファイル名:「1001日別売上」の左側へ「2022」を追加し、「202 6 2022/10/14 10:03
- Visual Basic(VBA) VBA 画面上のカーソルに文字数字を入力するコードを教えて下さい 1 2022/10/30 10:31
- Excel(エクセル) Excelにて、フォルダ内のTextファイルをマクロで統合すると文字化けしてしまう時の解消コード 4 2023/01/01 07:32
- C言語・C++・C# S-JIS → JIS コード変換するには 3 2023/02/09 23:55
- JavaScript ブックマークレットについて 2 2022/10/09 11:48
- Visual Basic(VBA) 指定文字以外のカウント 4 2023/05/03 14:37
- Excel(エクセル) Excelの操作方法を教えてください!頭文字2~8文字で特定の値に返す方法 8 2022/07/14 11:26
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
BASP21によるbase64のデコード...
-
Perl:ファイル名だけ文字化けする
-
CSVファイルの中で、「 , 」カ...
-
英数字のみ全角から半角に変換
-
エクセルで数値を全角文字(カ...
-
マクロを使ってフォルダー内に...
-
IEからEdgeへの移行に伴うIMEの...
-
カンマ区切りの数字をCSVフ...
-
Excel VBAでPDFファイルをMicro...
-
EXCELからCSVにすると余計なカ...
-
エクセルにMicrosoft Barcode C...
-
各項目がダブルクォーテーショ...
-
ダブルコーテーションの置換
-
csvデータ ダブルクォーテ...
-
VBA 置換文字がみつからない時
-
正規表現で、特定の文字列を含...
-
CString から LPCTSTRの型に変換
-
スペースで区切られた氏名から...
-
プログラミングでは、半角括弧...
-
カンマ区切り
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
pythonエラー
-
Perl:ファイル名だけ文字化けする
-
IMAP4でsubjectが検索ヒットしない
-
URLエンコードされたデータを戻...
-
1つのサイトで文字コードが混在...
-
perlの日本語文字コードはどう...
-
テキストファイルから日本語部...
-
メール(iso-2022-jp-2)のデコ...
-
jisコードで16進数の『3c』か...
-
「繝・せ繝・」となる文字化け
-
Encodeモジュールで日本語化したい
-
jcode.pmでconvertできない
-
quoted-printableのアルゴリズム
-
Encode.pmで文字コードの判別
-
CASLIIの数値データ入出力
-
BASP21によるbase64のデコード...
-
Perlでのメール本文の解析について
-
PerlでJavaScriptを作成してい...
-
CSVファイルの中で、「 , 」カ...
-
何故、日本は未だに数字を3桁...
おすすめ情報