プロが教える店舗&オフィスのセキュリティ対策術

統計手法について質問です。
クラスター分析はいくつも変数がある場合に似たもの同士のグループを作ることができますが、
変数が1つの場合も利用することはできますか?
もしできなければ、どの統計的手法で変数が1つの場合のグループ分けができますか?

A 回答 (2件)

企業でSQCを推進する立場にある者です。



1変量でも可能です。

しかし、通常のクラスター分析では、
サンプル間の距離をどう定義するかを選ぶオプションがあり、
ユークリッド距離のほか、
マハラノビス距離、コサイン距離、
マンハッタン距離、キャンベラ距離・・・等々の
空間距離が候補としてあるのですが・・・、

1次元ですので、各サンプルの距離は、
単純な差分しか計算できないため、
上記の分類では、ユークリッド距離を使わざるを得ません。

また、クラスター分析は、分布の重なりあいを考慮しません。
二山分布などがあっても、
その境界で強引に線引きします。
そのため、
①各群間の重心が遠ざかる
②各群の分散が小さくなる
という点に注意しなければなりません。

その対策として、EMアルゴリズムを駆使して解く
「混合ガウス分布」と言う方法があります。
これであれば、各群の重心やばらつきが温存されます。

Rですと「Mclust」という関数になります。
    • good
    • 2
この回答へのお礼

ご回答ありがとうございました。
教えていただいた方法について、また調べてみます。

お礼日時:2017/10/31 10:53

#1です。

たまたま、読み返していたら間違いに気付きました。

誤 ①各群間の重心が遠ざかる

正 ①各群の重心が遠ざかる
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!