dポイントプレゼントキャンペーン実施中!

変量がp個の場合の主成分分析で、相関行列(の二乗和)に着目した時の話です。
この時の、第二主成分を求める手順、式変形、式変形が成り立つ理由がいまいち理解できません。
主成分分析、あるいは多変量解析の教科書は複数冊に目を通しているのですが、理解力が足りないようで…。
うまく説明できる方、宜しくお願いします。

A 回答 (1件)

相関行列に着目する場合は、分散(データの散らばり、二乗和)に着目します。



第1主成分P1は、データXの分散の最も大きい方向を示しています。(P1の計算方法は省略。)
この時点で、第1主成分に対するの係数A1は、第1主成分方向との内積A1=X×P1/|P1|として得られます。

第2主成分P2は、第1主成分方向を除いた(ゼロとする)場合の残りのデータ(X2 = X-A1×P1/|P1|)の分散の最も大きい方向を示します。(P2の計算方法は省略。)
ポイントは、このときのデータX2が、p個の変量で表している座標をp-1個の新たな変量(第2~p主成分に相当)で表せる状態にあることです。
第2主成分に対する係数A2は、第2主成分方向との内積A2=X2×P2/|P2|(=X×P2/|P2|:P1×P2=0より)として得られます。

第3主成分以降も第2主成分と同様の手順で順次求めることができます。

第p主成分までもとまれば、データXを係数Aと主成分Pで
X =A1×P1+A2×P2+...+Ap×Ppであらわせます。
    • good
    • 0
この回答へのお礼

ありがとうございます!
理解が深まりました。
さらに勉強を続けていきたいと思います。

お礼日時:2007/06/11 10:08

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!