Encode.pmのPODを読んでいます。その一文です。
[$obj =] find_encoding(ENCODING)
Returns the encoding object corresponding to ENCODING. Returns undef if no matching ENCODING is find.
This object is what actually does the actual (en|de)coding.
$utf8 = decode($name, $bytes);
is in fact
$utf8 = do{
$obj = find_encoding($name);
croak qq(encoding "$name" not found) unless ref $obj;
$obj->decode($bytes)
};
with more error checking.
まず
This object is what actually does the actual (en|de)codeing.
直訳すると、「このオブジェクトは実際のエンコードやデコードを実際に行うものです。」となります。実際の、実際の、と二つ並ぶのはあまり語感が良くないと思いますが、でもこのPODを書いたのは文学者ではないですから、原文の方に問題があるのではないかと思います。
次に「このオブジェクト」とは何を指しているのでしょう。find_encoding関数のことを言っているのでしょうか?
というのは、下に
$utf8 = decode($name, $bytes);
は実際には、
$utf8 = do{
$obj = find_encoding($name);
croak qq(encoding "$name" not found) unless ref $obj;
$obj->decode($bytes)
};
だと書いています。{}の中で一番重要なのはfind_encoding関数だと言いたいのではないかと・・・
そうすると
This object is what actually does the actual (en|de)codeing.
は、
「実際にエンコードやデコードを行っているのはこの関数です。」
と訳するのが正しいでしょうか?
最後に、
$obj->decode($bytes)
$objという文字コードで記述されている$bytesという文字列をutf-8に変換したもの、という意味なはず。
でも浅学な私には、どのような文法でこのコードが書かれているか分かりません。
Perlにおいて、変数と言えば$objだったり@objだったり%objだったりします。そしてそのリファレンスはこれら変数の前に「\」を付ければ良くて、リファレンスはスカラー変数となるから、
$refobj=\($|@|%)obj;
となります。
元の変数が(@|%)objの場合、元の変数の一要素を取り出すには、
$obj([index]|{'index'})=$refobj->index;
となります。
これが私の知っている矢印記法の唯一の使い方です。
お手数ですが、どなたか教えていただけないでしょうか?
No.1ベストアンサー
- 回答日時:
This object is what actually does the actual (en|de)coding.
のobjectは、その前の文の
Returns the encoding object corresponding to ENCODING. Returns undef if no matching ENCODING is find.
にある
find_encoding(ENCODING) が返す encoding オブジェクトのことです。
> 最後に、
> $obj->decode($bytes)
>
>$objという文字コードで記述されている$bytesという文字列をutf-8に変換したもの、という意味なはず。
ちがいます。
この$obj は $obj = find_encoding($name); で作られた encoding object です。
$objというオブジェクトの decode メソッドを$bytes という引数を
渡して呼び出しています。その結果が $utf8に代入されています。
No.3
- 回答日時:
すでに良い回答が付いているので、ひとつだけ。
> $obj->decode($bytes)
> $objという文字コードで記述されている$bytesという文字列をutf-8に変換したもの、という意味なはず。
Perlの内部形式が UTF-8 であるからにはそうとも言えますが、違う理解をした方が良いですよ。
$obj->decode($bytes) は、「$objという文字コードで記述されている$bytesという文字列を内部形式にインポートする」ものと理解してください。 実際、$bytesという文字列が元々 UTF-8 であっても、decode() してはじめて内部形式として使用できます。
そのあたりの理解が進むまでは、「内部形式は、既知のどの文字コードとも異なる」と思っていた方が、うまくいくケースが多いと思います。
私が言う内部形式というのはマニュアルでは「UTF-8フラグが付いた文字列」とか言う表現になりますが、私はこのネーミングは入門者に優しくないと思っています。
まだUTF8フラグとかが良く分かっていません。UTF8フラグがあるんだったらShift-JISフラグとかありそうですけど、これまで耳に挟んだことがないのは何故なのか・・・
この当りはまだ勉強を始めたばかりなので、もう少し文献を読みすすめてみます。
ありがとうございました。
No.2
- 回答日時:
一番最初の
> Returns the encoding object corresponding to ENCODING. Returns undef if no matching ENCODING is find.
この文の意味をちゃんと読み取ってください。
> (find_encoding 関数は) ENCODING に対応する「エンコーディングオブジェクト」を返します。対応する ENCODING が見つからない場合には undef を返します。
という文の続きで、The object…という文があるわけで、
> 次に「このオブジェクト」とは何を指しているのでしょう。
object とは、find_encoding関数が返す値のことです。
> $obj->decode($bytes)
これは、オブジェクト $obj のクラスに属する関数 decode の呼び出しです。
引数 $bytes は、この decode 関数によって変換され、この関数の戻り値が、変数 $utf8 に代入されます。
Perl では、オブジェクト指向の実現方法としてリファレンスを使用しています。
まずはPerlにおけるオブジェクト指向について勉強するのが先だと思います。
この数日でPerlのオブジェクト指向について書いた本を読みこなしてみました。
分かった・・・というか、まだ分かっていないけど、知った後では、最初の訳は赤面物ですね。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- C言語・C++・C# leetcode 155 minstack 1 2022/05/07 16:43
- JavaScript EasyUIのSubGrid(jquery)におけるObjectに入れた連想配列について 1 2022/05/02 11:21
- その他(プログラミング・Web制作) pythonのこのエラーがわかりません 3 2022/11/16 14:54
- Visual Basic(VBA) EXCEL VBAにて動的にCheckBOXを複数作成し、同BOXにイベントを追加したい 1 2023/03/16 07:05
- その他(SNS・コミュニケーションサービス) 自分のpcがハッキングされたようなメールが来たのですがどうすればいいですか? 4 2022/10/02 16:14
- その他(プログラミング・Web制作) pythonで変数にオブジェクトを代入するにはどうしたらよいでしょうか 2 2023/08/20 20:36
- その他(プログラミング・Web制作) Pythonで会員サイトの自動ログイン ID Nameがない 1 2022/12/16 02:09
- Visual Basic(VBA) オブジェクトが見つかりません 1 2023/06/24 19:43
- その他(プログラミング・Web制作) pythonのpandasのcsvの外部結合(outer_join)した際に列が想定とは異なる事象 1 2022/05/25 13:23
- Visual Basic(VBA) 集めたシートのシート名を変更したい。 下記のコードでサブフォルダにあるファイルのSheet3を集めて 6 2022/08/23 10:38
関連するカテゴリからQ&Aを探す
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
perl でエラー:Wide character...
-
WindowsでUTF-8のPerlスクリプ...
-
$obj->decode($bytes)って何?
-
jcode.plのかわり
-
MFCのコントロールにUTF-8の文...
-
CSVファイルの中で、「 , 」カ...
-
英数字のみ全角から半角に変換
-
CString から LPCTSTRの型に変換
-
エクセルで数値を全角文字(カ...
-
「何とかで始まり、何とかで終...
-
VBA 文字に半角が含まれて...
-
EXCELからCSVにすると余計なカ...
-
正規表現で、特定の文字列を含...
-
ダブルコーテーションの置換
-
データにカンマが入ったCSVデー...
-
VBA 置換文字がみつからない時
-
カンマ区切りの数字をCSVフ...
-
マクロを使ってフォルダー内に...
-
VBで、String型のデータが、...
-
各項目がダブルクォーテーショ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
perl でエラー:Wide character...
-
jcode.plのかわり
-
MFCのコントロールにUTF-8の文...
-
【LaTeX】pBibTeXでのエラーの...
-
Perlで、文字の出現回数を調べ...
-
Cannot decode string with wid...
-
PerlでRSS取得 ~ 文字化け ~ ...
-
PHPの文字化けについて
-
HTML::Templateでutf-8のテンプ...
-
printfの書式指定での2バイト文...
-
sedやperlでの2バイト文字を含...
-
pythonの文字コードとファイル操作
-
デバッグ情報が文字化けする
-
JAVAでMySQLに接続すると日本語...
-
Java+MySQLで特殊文字(丸数字(...
-
オブジェクト? perlをオーバー...
-
WWW::Mechanizeの文字コードに...
-
UTF-16からUTF-8への変換
-
機種依存文字(株)を入力すると\...
-
XMLパラメータの取り込みに関して
おすすめ情報