相関行列による主成分分析

解決済

質問者：type-RRR
質問日時：2007/06/10 18:17
回答数：1件

変量がp個の場合の主成分分析で、相関行列（の二乗和）に着目した時の話です。
この時の、第二主成分を求める手順、式変形、式変形が成り立つ理由がいまいち理解できません。
主成分分析、あるいは多変量解析の教科書は複数冊に目を通しているのですが、理解力が足りないようで…。
うまく説明できる方、宜しくお願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (1件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： qqtester
回答日時：2007/06/11 02:12

相関行列に着目する場合は、分散（データの散らばり、二乗和）に着目します。

第１主成分P1は、データXの分散の最も大きい方向を示しています。（P1の計算方法は省略。）
この時点で、第１主成分に対するの係数A1は、第１主成分方向との内積A１=X×P１/｜P１｜として得られます。

第２主成分P２は、第１主成分方向を除いた（ゼロとする）場合の残りのデータ（X２ = X-A１×P１/｜P１｜）の分散の最も大きい方向を示します。（P２の計算方法は省略。）
ポイントは、このときのデータX２が、ｐ個の変量で表している座標をｐ－１個の新たな変量（第２～ｐ主成分に相当）で表せる状態にあることです。
第２主成分に対する係数A２は、第２主成分方向との内積A２=X２×P２/｜P２｜（＝X×P２/｜P２｜：P１×P２＝０より）として得られます。

第３主成分以降も第２主成分と同様の手順で順次求めることができます。

第ｐ主成分までもとまれば、データXを係数Aと主成分Pで
X =A1×P1＋A２×P２＋...＋Aｐ×Pｐであらわせます。