アプリ版:「スタンプのみでお礼する」機能のリリースについて

数十社分、各社数十個の属性データ(金額等の数値)を時系列で年次5年分あります。
この属性データをもとに幾つかの会社のグループに分けられる行動パターンが分析できないかと思案しています。
この場合のパターンとは例えば各種資産の持ち方の時系列での推移がAグループとBグループで異なる傾向がある等です。
単純な相関分析では属性間の相関しかみれず、各社の行動パターンのグルーピングも出来ない気がします。
この場合適切な統計分析の方法を教えて下さい。よろしくお願いします。

A 回答 (1件)

基本的には、データと対話するしかないでしょう。

あるやり方を試してみて、それが思わしくなかったら別のやり方を考える、ということを繰り返すのです。

グルーピングといえばクラスター分析がまず浮かびますが、解釈の苦しい結果に終わることもありがちです。手始めに、こんなのはどうでしょうか。

1 データを単純化するため、ひとまず時系列を無視し、各属性の5年間の平均を使うことにする。

2 平均を使うにしても、属性が数十個あると扱いにくいので、主成分分析により、主成分2つだけ抽出する。各会社の属性を、この2つの主成分に回帰する(主成分スコアを求める)。

3 主成分を2つに絞ったことにより、各会社の主成分スコアを平面上にプロットできる。そのプロット図をみて、グルーピングの見当をつける。そのうえで、2つの主成分だけを使ってクラスター分析でグルーピングする。あるいは、第1象限、第2象限、第3象限、第4象限と4つにグルーピングする。

4 元の数十個の時系列データに戻って、グループごとの特徴(増加/減少や、景気指標との相関など)があるかを確かめる。
    • good
    • 0
この回答へのお礼

ありがとうございます。
時系列推移と属性項目の二つをみてグルーピングする手法を知らないので参考になりました。
確かにクラスター分析で意味ある結果と説明力があるかは分かりませんね。
地道にデータと対話してみます。

お礼日時:2013/08/14 03:58

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!