最速怪談選手権

Encode.pmのPODを読んでいます。その一文です。


[$obj =] find_encoding(ENCODING)
 Returns the encoding object corresponding to ENCODING. Returns undef if no matching ENCODING is find.

 This object is what actually does the actual (en|de)coding.

 $utf8 = decode($name, $bytes);
 is in fact
  $utf8 = do{
   $obj = find_encoding($name);
   croak qq(encoding "$name" not found) unless ref $obj;
   $obj->decode($bytes)
  };
 with more error checking.


まず
 This object is what actually does the actual (en|de)codeing.

直訳すると、「このオブジェクトは実際のエンコードやデコードを実際に行うものです。」となります。実際の、実際の、と二つ並ぶのはあまり語感が良くないと思いますが、でもこのPODを書いたのは文学者ではないですから、原文の方に問題があるのではないかと思います。

次に「このオブジェクト」とは何を指しているのでしょう。find_encoding関数のことを言っているのでしょうか?

というのは、下に
 $utf8 = decode($name, $bytes);
は実際には、
 $utf8 = do{
  $obj = find_encoding($name);
  croak qq(encoding "$name" not found) unless ref $obj;
  $obj->decode($bytes)
};
だと書いています。{}の中で一番重要なのはfind_encoding関数だと言いたいのではないかと・・・

そうすると
 This object is what actually does the actual (en|de)codeing.
は、
 「実際にエンコードやデコードを行っているのはこの関数です。」
と訳するのが正しいでしょうか?


最後に、
 $obj->decode($bytes)

$objという文字コードで記述されている$bytesという文字列をutf-8に変換したもの、という意味なはず。

でも浅学な私には、どのような文法でこのコードが書かれているか分かりません。

Perlにおいて、変数と言えば$objだったり@objだったり%objだったりします。そしてそのリファレンスはこれら変数の前に「\」を付ければ良くて、リファレンスはスカラー変数となるから、
$refobj=\($|@|%)obj;
となります。

元の変数が(@|%)objの場合、元の変数の一要素を取り出すには、
$obj([index]|{'index'})=$refobj->index;
となります。

これが私の知っている矢印記法の唯一の使い方です。


お手数ですが、どなたか教えていただけないでしょうか?

A 回答 (3件)

This object is what actually does the actual (en|de)coding.


のobjectは、その前の文の
Returns the encoding object corresponding to ENCODING. Returns undef if no matching ENCODING is find.
にある
find_encoding(ENCODING) が返す encoding オブジェクトのことです。


> 最後に、
> $obj->decode($bytes)
>
>$objという文字コードで記述されている$bytesという文字列をutf-8に変換したもの、という意味なはず。

ちがいます。
この$obj は $obj = find_encoding($name); で作られた encoding object です。
$objというオブジェクトの decode メソッドを$bytes という引数を
渡して呼び出しています。その結果が $utf8に代入されています。
    • good
    • 0
この回答へのお礼

なるほど。オブジェクトというものがまるで分かっていないからこういう語訳になるのですね。

ありがとうございました。

お礼日時:2009/06/01 22:14

すでに良い回答が付いているので、ひとつだけ。



> $obj->decode($bytes)
> $objという文字コードで記述されている$bytesという文字列をutf-8に変換したもの、という意味なはず。

Perlの内部形式が UTF-8 であるからにはそうとも言えますが、違う理解をした方が良いですよ。

$obj->decode($bytes) は、「$objという文字コードで記述されている$bytesという文字列を内部形式にインポートする」ものと理解してください。 実際、$bytesという文字列が元々 UTF-8 であっても、decode() してはじめて内部形式として使用できます。

そのあたりの理解が進むまでは、「内部形式は、既知のどの文字コードとも異なる」と思っていた方が、うまくいくケースが多いと思います。


私が言う内部形式というのはマニュアルでは「UTF-8フラグが付いた文字列」とか言う表現になりますが、私はこのネーミングは入門者に優しくないと思っています。
    • good
    • 0
この回答へのお礼

まだUTF8フラグとかが良く分かっていません。UTF8フラグがあるんだったらShift-JISフラグとかありそうですけど、これまで耳に挟んだことがないのは何故なのか・・・

この当りはまだ勉強を始めたばかりなので、もう少し文献を読みすすめてみます。

ありがとうございました。

お礼日時:2009/06/01 22:19

一番最初の


> Returns the encoding object corresponding to ENCODING. Returns undef if no matching ENCODING is find.
この文の意味をちゃんと読み取ってください。

> (find_encoding 関数は) ENCODING に対応する「エンコーディングオブジェクト」を返します。対応する ENCODING が見つからない場合には undef を返します。

という文の続きで、The object…という文があるわけで、
> 次に「このオブジェクト」とは何を指しているのでしょう。
object とは、find_encoding関数が返す値のことです。

> $obj->decode($bytes)

これは、オブジェクト $obj のクラスに属する関数 decode の呼び出しです。
引数 $bytes は、この decode 関数によって変換され、この関数の戻り値が、変数 $utf8 に代入されます。

Perl では、オブジェクト指向の実現方法としてリファレンスを使用しています。
まずはPerlにおけるオブジェクト指向について勉強するのが先だと思います。
    • good
    • 0
この回答へのお礼

この数日でPerlのオブジェクト指向について書いた本を読みこなしてみました。

分かった・・・というか、まだ分かっていないけど、知った後では、最初の訳は赤面物ですね。

ありがとうございました。

お礼日時:2009/06/01 22:16

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!