No.1ベストアンサー
- 回答日時:
(昨今の)Perlには「utf8フラグ」なるものがあります。
通常、日本語の仮名や漢字は、複数の文字を組み合わせて表現しています。
例えば、「ア」という文字は
Shift_JISなら \x83\x41 という「2文字」
UTF-8なら \xE3\x82\xA2 という「3文字」
です。
この状態は、1バイト1バイトの文字が並んでいる状態なので、「バイト列」と呼ぶことにします。(バイナリと呼んだりもします)
ファイルには、この形で入っています。
この方式だと、「ア」が1文字として扱われずいろいろと不便です。
例えば、 Shift_JISのアに含まれる \x41 はASCIIコードでのAです。
ここで、s/A/B/ とすると、 AがBに書き変わるだけでなく、ア( \x83\x41)がィ (\x83\x42)に書き変わってしまいます。
そこで、これらを統一扱う「内部形式」というのを作りました。
それが「utf8フラグ付き文字列」です。
読み込み時は
ファイルや文字列変数でのバイト列 → 復号( decode ) → 内部形式(utf8フラグ付き文字列)
書き出し時には
内部形式 → 符号(encode) → ファイルや文字列変数でのバイト列
とすることで、内部形式では「ア」を一文字として扱うことができます。s/A/B/としてもアには影響ありません。
復号/符号 は入出力時に自動で行なうようにしたり、Encodeモジュールのdecode,encode等を使用して明示的に行なったりします。
この書き出しの時に、
内部形式 → 符号(encode) → ファイルや文字列変数でのバイト列
としなければならないところを
内部形式 → ファイルや文字列変数
と直接おこなってしまった場合、そんなことはできない、と発生するのが「 wide character 〜」の警告です。
対処法は、 上記のようにencodeすることです。
また、場合によっては decode を抑制して 最初からバイト列で扱う方が正しいこともあります。
具体的なことは、実際のコードとやろうとしていることがわかならないと答えられません。
とても丁寧なご教示有難うございます。
shift-jisで処理していますので、最初に、
Encode::from_to($content, "shift-jis", "euc-jp");
と書き込み、データ出力前に
Encode::from_to($content, "euc-jp", "shift-jis");
と言うような形で対応するのでしょうか?
重ねてご教示頂けましたら有難く存じます。
No.3
- 回答日時:
$content が utf-8 フラグのついた文字列である場合,
Encode::from_to($content, "utf-8", "shift-jis");
は
$content = Encode::encode($content, "shift-jis");
と同じになります (個人的に from_to は使ってないのでちょっと違うかもしれん).
最後の
「エラーメッセージはあっても関係ない、
ということでしょうか」
は, 何を聞いているんでしょうか?
有難うございます。
$content = Encode::encode($content, "shift-jis");
を入れてみます。
No.2
- 回答日時:
そうとう昔の Perl から内部的には UTF-8 を使うので
1. 外から与えられた文字列は Encode::decode で UTF-8 に変換する
2. その UTF-8 な文字列を使って処理をする
3. 外に出すときに Encode::encode でそれなりな文字コードに戻す
とするんだよ... と #1 はいっている.
有難うございます。
Encode::encode でそれなりな文字コードに戻って帰って来る
ということですか。
Encode:from_to($content,"utf-8","shift-jis");
としなくてもよい、ということですか。
エラーメッセージはあっても関係ない、
ということでしょうか。
もう少し教えて頂けるとありがたいのですが。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Ruby pythonエラー 4 2022/11/11 19:12
- その他(プログラミング・Web制作) invalid character in identifier 2 2022/07/18 10:14
- その他(プログラミング・Web制作) python flask から fastapiへの移行時のエラー対処 1 2023/02/05 12:26
- MySQL MYSQL エラー 2 2022/10/18 11:37
- その他(プログラミング・Web制作) Pythonで会員サイトの自動ログイン ID Nameがない 1 2022/12/16 02:09
- その他(プログラミング・Web制作) pythonのこのエラーがわかりません 3 2022/11/16 14:54
- その他(プログラミング・Web制作) python 2 2022/12/23 09:06
- Perl Perl の外部モジュールの利用方法 3 2022/07/10 18:34
- Ruby 教えてください 2 2023/01/04 17:50
- PHP php エラー 2 2022/10/23 16:43
このQ&Aを見た人はこんなQ&Aも見ています
-
性格の違いは生まれた順番で決まる?長男長女・中間子・末っ子・一人っ子の性格の傾向
同じ環境で生まれ育っても、生まれ順で性格は違うものなのだろうか。家庭教育研究家の田宮由美さんに教えてもらった。
-
Can't use string (0") as an ARRAY ref の原因について"
Perl
-
cgi 実行時のエラー
Perl
-
特定の文字列を削除
Perl
-
-
4
全角ひらがな、漢字をマッチさせたい
Perl
-
5
Perlで Right関数に近い処理をさせたいのですが、何か良い方法は無いでしょうか?
Perl
-
6
perlからJavascriptを起動
Perl
-
7
上位階層のディレクトリパスを取得する方法
Perl
-
8
半角→全角変換
Perl
-
9
Perlスクリプトで文字化けしてしまう
Perl
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
perl でエラー:Wide character...
-
jcode.plのかわり
-
MFCのコントロールにUTF-8の文...
-
CGIでメール送信で件名文字化け
-
【LaTeX】pBibTeXでのエラーの...
-
JcodeモジュールとEncodeモジュ...
-
Perlバージョン違いと use enco...
-
perlについての質問
-
CSVファイルの中で、「 , 」カ...
-
英数字のみ全角から半角に変換
-
エクセルで数値を全角文字(カ...
-
IEからEdgeへの移行に伴うIMEの...
-
EXCELからCSVにすると余計なカ...
-
CString から LPCTSTRの型に変換
-
VBで、String型のデータが、...
-
マクロを使ってフォルダー内に...
-
VB.net、テキストボックス入力...
-
エクセルにMicrosoft Barcode C...
-
[VBA][Excel]クリップボードか...
-
カンマ区切りの数字をCSVフ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
perl でエラー:Wide character...
-
jcode.plのかわり
-
MFCのコントロールにUTF-8の文...
-
【LaTeX】pBibTeXでのエラーの...
-
Perlで、文字の出現回数を調べ...
-
Cannot decode string with wid...
-
PerlでRSS取得 ~ 文字化け ~ ...
-
PHPの文字化けについて
-
HTML::Templateでutf-8のテンプ...
-
printfの書式指定での2バイト文...
-
sedやperlでの2バイト文字を含...
-
pythonの文字コードとファイル操作
-
デバッグ情報が文字化けする
-
JAVAでMySQLに接続すると日本語...
-
Java+MySQLで特殊文字(丸数字(...
-
オブジェクト? perlをオーバー...
-
WWW::Mechanizeの文字コードに...
-
UTF-16からUTF-8への変換
-
機種依存文字(株)を入力すると\...
-
XMLパラメータの取り込みに関して
おすすめ情報