プロが教えるわが家の防犯対策術!

統計解析について、Kruskal-Wallisでの変数選択→決定木分析


三群にクラス分けされた群がどの様な項目が特徴的に分類されるか、決定木分析で解析したいのです。

決定木分析の独立変数を選択する際、Kruskal-Wallis検定で有意差の出たものを投入するという、統計処理方法は、良いのでしょうか?

統計学を専門的に学んだ事がなく、独学で勉強しているものです。

お願いします。

質問者からの補足コメント

  • 独立変数が多くなってしまうため、変数の絞り込みをしたく、Kruskal-Wallis検定にて変数選択をしたいと思いました。

      補足日時:2018/12/21 22:01

A 回答 (1件)

企業でSQCを推進する立場の者です。


実は、どんな回答が付くか見守っていました。

決定木は教師あり学習です。二進木とも呼ばれます。でも、ご質問者は3群だと言ってみえます。これが出来るソフトは、SPSS(IBM)のAnswerTreeしかありません。

ですから、回答が限定的になり、誰も回答しないのではないかと思います。

決定木は独立変数が多くても解析上は問題ありませんが、なぜ恣意的な絞り込みをしたかったのか、まずはその目的を述べないと、絞り込み方法が適切だったのかどうかは判断できないと思います。
決定木は、効いている変数の絞り込みに使われる手法ですから、なぜその前に別の方法で絞り込むのか、それが必要なマズイ原因でもあるのでしょうか。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
大変勉強になりました。

絞り込みをしたかったのは、決定木分析にも、重回帰分析の様に、サンプル数に制限?決まり?があると思ったからです。

解析ソフトは、Rを使用しました。
Rでも、三群でも分類できたのですが、使い方が間違ってるのでしょうか?

お礼日時:2018/12/23 11:42

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!