因子分析の結果、因子得点を使ったクラスタリングを行う際について

Question

広く一般的には、因子得点を階層分類（ウォード）や非階層分類（k-means）などを通してクラスター分析することが通例だと思いますが、質問です。
仮に因子分析の結果、4因子を抽出することができたとして、当然ですが各レコード（回答者）には4つの因子得点が付与されることになります。ここでレコードを分類（クラスタリング）する際、上記のような通例のクラスター分析を行わず、『単に、4因子をそのままクラスター特性と見なし、各レコードが持つ４因子得点のうち、最も高い得点をもつ因子（ここではそのままクラスター）に強制的に所属させる』という手法を用いた場合、どのような懸案が考えられるのでしょうか。

結果を解釈する上で、把握しておかなくてはいけない背景や知識があれば、と思います。
もっとも、因子分析ですとかクラスター分析の解釈自体が主観的なものですし、数学的・解析的に問題は無いと思いますが、ご意見伺いたいと思います。

勿論、最大値をとるとなると正の値に着目することになるので、負の値が特性を持つ場合に、その特性を無視してしまう、ということは承知の上です。
ただし、階層分類等を用いると、「因子得点が4つとも低いグループ」「因子得点が4つとも高いグループ」といった分類結果が見受けられ、クラスターの特性として傾向を見せにくい（「このクラスターはすべての因子に反応」とか「すべての因子に反応しない」など）ことが多々ありますので、このような質問をしている次第です。

有識者の方、ご意見をいただけれると幸いです。

raiching · Accepted Answer

>『単に、4因子をそのままクラスター特性と見なし、
>各レコードが持つ４因子得点のうち、
>最も高い得点をもつ因子（ここではそのままクラスター）に
>強制的に所属させる』という手法を用いた場合、
>どのような懸案が考えられるのでしょうか。
↑
「その結果の妥当性が低い」という懸案です。

具体例を挙げると ※fs(x)：第x因子の因子得点

■標本Ａ　fs(1)=2.0,fs(2)=-2.0,fs(3)=1.9,fs(4)=-2.0
⇒fs(1)が最大値のため、仮にクラスター１に分類

■標本Ｂ　fs(1)=1.9,fs(2)=-2.0,fs(3)=2.0,fs(4)=-2.0
⇒fs(3)が最大値のため、仮にクラスター３に分類

■標本Ｃ　fs(1)=2.0,fs(2)=1.9,fs(3)=-2.0,fs(4)=1.9
⇒fs(1)が最大値のため、仮にクラスター１に分類

本来のクラスター分析はパターン分類を行うため、
標本Ａと標本Ｂが同じクラスターになる可能性が高く、
標本ＣがＡ・Ｂと違うクラスターになる可能性が高い。

しかし因子得点の最大値を使うと、反応パターンが
似ていないもの同士を同じクラスターにする可能性がある。

少し手厳しくなりますが、
「因子軸やクラスターを解釈しにくいから」という理由で
妥当性の低い方法論を使うのであれば、最初からこういった
多変量解析には手をつけないほうが良いと思います。

因子分析の結果、因子得点を使ったクラスタリングを行う際について

>『単に、4因子をそのままクラスター特性と見なし、

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング