アプリ版:「スタンプのみでお礼する」機能のリリースについて

広く一般的には、因子得点を階層分類(ウォード)や非階層分類(k-means)などを通してクラスター分析することが通例だと思いますが、質問です。
仮に因子分析の結果、4因子を抽出することができたとして、当然ですが各レコード(回答者)には4つの因子得点が付与されることになります。ここでレコードを分類(クラスタリング)する際、上記のような通例のクラスター分析を行わず、『単に、4因子をそのままクラスター特性と見なし、各レコードが持つ4因子得点のうち、最も高い得点をもつ因子(ここではそのままクラスター)に強制的に所属させる』という手法を用いた場合、どのような懸案が考えられるのでしょうか。

結果を解釈する上で、把握しておかなくてはいけない背景や知識があれば、と思います。
もっとも、因子分析ですとかクラスター分析の解釈自体が主観的なものですし、数学的・解析的に問題は無いと思いますが、ご意見伺いたいと思います。

勿論、最大値をとるとなると正の値に着目することになるので、負の値が特性を持つ場合に、その特性を無視してしまう、ということは承知の上です。
ただし、階層分類等を用いると、「因子得点が4つとも低いグループ」「因子得点が4つとも高いグループ」といった分類結果が見受けられ、クラスターの特性として傾向を見せにくい(「このクラスターはすべての因子に反応」とか「すべての因子に反応しない」など)ことが多々ありますので、このような質問をしている次第です。

有識者の方、ご意見をいただけれると幸いです。

A 回答 (1件)

>『単に、4因子をそのままクラスター特性と見なし、


>各レコードが持つ4因子得点のうち、
>最も高い得点をもつ因子(ここではそのままクラスター)に
>強制的に所属させる』という手法を用いた場合、
>どのような懸案が考えられるのでしょうか。

「その結果の妥当性が低い」という懸案です。

具体例を挙げると ※fs(x):第x因子の因子得点

■標本A fs(1)=2.0,fs(2)=-2.0,fs(3)=1.9,fs(4)=-2.0
⇒fs(1)が最大値のため、仮にクラスター1に分類

■標本B fs(1)=1.9,fs(2)=-2.0,fs(3)=2.0,fs(4)=-2.0
⇒fs(3)が最大値のため、仮にクラスター3に分類

■標本C fs(1)=2.0,fs(2)=1.9,fs(3)=-2.0,fs(4)=1.9
⇒fs(1)が最大値のため、仮にクラスター1に分類

本来のクラスター分析はパターン分類を行うため、
標本Aと標本Bが同じクラスターになる可能性が高く、
標本CがA・Bと違うクラスターになる可能性が高い。

しかし因子得点の最大値を使うと、反応パターンが
似ていないもの同士を同じクラスターにする可能性がある。

少し手厳しくなりますが、
「因子軸やクラスターを解釈しにくいから」という理由で
妥当性の低い方法論を使うのであれば、最初からこういった
多変量解析には手をつけないほうが良いと思います。
    • good
    • 0
この回答へのお礼

回答ありがとう御座います。
回答者さまの言うとおり、パターン分類との違いが明らかですよね。
最後の手厳しい(笑)ご意見をしかと受け止めます。
迅速に有難う御座いました。また引続きご意見などあれば、投稿お願いします。

お礼日時:2009/02/26 10:28

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!