30項目、10段階評価(非常にそう思う~どちらでもない~まったくそう思わない)のアンケート設問をもとに、因子分析(回答者に各因子スコア付与)とクラスター分析を用いて回答者をセグメンテーションした結果があります。現在、セグメントは1,000名の回答結果に対して4セグメント生まれました。
そこで有識者の皆様に質問があります。
次回、また同じアンケート(30項目、10段階評価)を別の回答者に対して行った際、同じロジックになよってセグメントされるようにしたいのですが(アルゴリズムを公式化・設問を汎用化運用したいのですが)、その手順というのは、
(1)1,000名の元の回答者とセグメント(4分類)を紐付け
(2)1,000名の元の「30項目10段階評価」の結果を説明変数とし、判別されたセグメント(4分類)を目的変数とした(非線形?)回帰分析式を求める
(3)新たな(別の)回答者の「30項目10段階評価」の回答を、(2)で作成した回帰分析式に代入
(4)セグメント判別
という流れで当たっていますか?
何か、参考になるURLでもかまいませんので、ご教授いただけますでしょうか。
どうぞ、よろしくお願いいたします。
No.2ベストアンサー
- 回答日時:
手元にある本を見直してみたら、下記の本に因子分析等の空間付置を行う分析手法で時系列分析をどうするかという、まさに今回のテーマに近い解説がありました。
「入門 多変量解析の実際 第2版」
http://www.amazon.co.jp/o/ASIN/4061539639/
※トラブルシューティングの項
クラスター分析の時系列適用も、似たような実例が載っていました。
ただし、ある程度手法の意味が分かっていないと、適用はできないかもしれません(数学的な手続きまで説明しているわけではない)。まあ、それほど高い本ではないので見てみてください。
迅速なる回答、誠に有難うございます!!
私自身、因子分析やクラスター分析はSPSSを使って「アルゴリズムを回してアウトプットを出す」という短絡的・単純的に日常的に使用しています。おおよその意義は理解しているつもりではありますが、今回のように、一度クラスタリングしたそのロジックを、他のサンプルに対して汎用的に再活用するということは、理解を超えておりました。
この度は説明不足にもかかわらず、懇切丁寧な回答をどうもありがとうございます。
また何かありましたら、是非、宜しくお願い致します。
No.1
- 回答日時:
因子分析はデータの特徴を相対的な観点から抽出する手法ですので、別のサンプルセットに対して適用すると同一の結果にはなりません。
分析の目的が良く分からないので一概には言えませんが、「同じロジックによってセグメント」することが重要である場合、因子分析を使うこと自体が問題とも言えます。また、クラスター分析は(上の手続きでは)因子スコアを使ってたまたま4つに分けたのであり、同じ数のセグメントに分けるという考え方は誤っています(時間が経てば回答者は変化するわけで、違うセグメントを設定した方が適切であったり、そこまではいかなくても従来のセグメントからははずれたサンプルが出てくるのが普通です)。
従って、(2)の回帰という手法を採ることは考えづらいですね。
絶対的な正解はないと思いますが、因子分析に関しては
1)古いデータの因子スコアをそのまま利用する
2)古いデータと新しいデータをまとめたデータで再度因子分析する
のどちらかが多いように思います。ただ、新しいデータだけで因子分析を行って、構造が大きく変わっていないことは確認しないといけないでしょう。
クラスター化に関しては、新しいデータだけでクラスタリングを再度行うか、新旧データでまとめてクラスタリングをやり直すか。また、古いクラスタリングを見ながら、重心からの距離等(最初のクラスタリングで使った手法にもよりますが)でどのクラスターに含めるかを恣意的に決めるかといったところではないでしょうか。
この回答への補足
仰るとおり、目的によっても異なりますね。
ご迷惑でなければもう少し、伺っても良いでしょうか。
後半でご指摘の「古いクラスタリングを見ながら、重心からの距離等・・・」というのが、今回、まさしく使いたい手法です。
※回帰分析で云々、というのは見当違いであることを認識いたしました。
そこで、そのようなやり方の参考になるような書籍(手順や手法の教科書的なものですと幸いです)やURLをご存知でしたら教えて頂けますでしょうか?
どうぞよろしくお願い致します。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 心理学 満足度調査の回帰分析 0 2023/05/11 08:39
- 統計学 統計に関する質問です 3 2022/05/19 20:21
- 面接・履歴書・職務経歴書 就活について 3 2022/11/21 14:37
- 統計学 回帰分析検証不一致 5 2022/05/04 20:48
- 統計学 マルチレベル分析について 2 2023/02/21 09:36
- 統計学 Rを用いた「繰り返しがある直交表実験計画法」の分析方法 8 2023/08/01 17:58
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- Excel(エクセル) 再質問 エクセル「社員の重なっている仕事時間の算出方法について」教えてください。 10 2023/02/07 19:16
- 大学・短大 大学 統計学 2 2022/09/18 15:06
- 宇宙科学・天文学・天気 AIが答えた方程式 1 2023/02/20 00:12
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
なぜ、北総鉄道は運賃値下げが...
-
BSA分析(Benefit Structure An...
-
司法取引について4,000字以上の...
-
児童数の調べ方について教えて...
-
宮内庁は3親等まで身辺調査が...
-
調査サイト「美トリ」で報酬が...
-
統計学的に信頼のあ有効率は、...
-
地質調査(ボーリング)は何箇...
-
警察って個人のパソコンやスマ...
-
帝国データから調査したいとい...
-
リサーチャーって言う仕事に就...
-
リファレンスチェックなるもの...
-
明治小粒チョコのCM
-
N/Rとは何の略
-
転職活動中です 身辺調査されま...
-
指定した値以上の中で最小値を...
-
電子公告の掲載期間
-
覆面レストラン調査バイト
-
J-STATS OPTA(オプタ)のデー...
-
FDAのデータの入手方法
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
BSA分析(Benefit Structure An...
-
何で小田急と京王はエリアがか...
-
コンテキスト分析
-
スマートフォンに関連する企業(...
-
突然の不動産マーケティング部...
-
マーケティングとはどれだけ情...
-
「競合」の使い方について
-
アナリスト
-
警察って個人のパソコンやスマ...
-
N/Rとは何の略
-
調査サイト「美トリ」で報酬が...
-
社会福祉調査の基礎
-
リサーチャーって言う仕事に就...
-
宮内庁は3親等まで身辺調査が...
-
地質調査(ボーリング)は何箇...
-
帝国データから調査したいとい...
-
この歯ブラシ使ったら、虫歯が...
-
会社内の内部通報制度で通報が...
-
eKYC(Povo、メルカリ、ヤフオク...
-
重要事項説明事項で建物状況調...
おすすめ情報