プロが教えるわが家の防犯対策術!

数量化2類の変数選択についてR言語でくむやり方を教えてください。いちょう目的変数は3群、説明変数を28項目としています。どうかよろしくお願いいたします

A 回答 (1件)

企業でSQCを推進する者です。



判別分析は、回帰分析とはモデルが逆ですので、
目的変数,説明変数は逆ではありませんか。

有名なあやめのデータで説明すると、
はなびらの長径,短径、がくの長径,短径から、あやめの種類が決まるわけではありません。
あやめの種類が先に決まっていて、各観測変数は従属的に発生しています。

やってみえることは、数量化I類なのではないですか。
言いかえれば、群を逆推定をしたいのだが、その時に用いる因子は?ということです。

すると、一般化線形モデルの中の多項ロジット回帰という手法になります。
ライブラリ、glmnetを使います。
スクリプトは、もう少しやりたいことが具体的になっていないと書けません。

多項ロジットは、第1群とそれ以外、第2群とそれ以外、第3群とそれ以外、という
解析結果になりますので、各群での有意な因子の標準回帰係数から回帰変動を求め、
その2乗和を合算することにより、総合的な効き具合が順位付けできます。

私は、この方法を
判別分析のような古典的方法ではなく、混合ガウス分布(ライブラリMclust)で層別した後、
層別に寄与していた因子をスクリーニングする際に使用しています。

ただし、この方法は、かなり高度ですので、
統計にもRにも習熟していないと、チンプカンプンだと思います。

必要ならば、スクリプトまで示します。
    • good
    • 0
この回答へのお礼

どうもありがとうございます。実は今、大学の
卒業研究で数量化2類において変数選択をしなければならない状況で、(何せ説明変数が28こあるもので)指導教員からのアドバイスは有意水準を5%として変数選択に分割表のカイ2乗検定を行い、有意な差があった説明変数を用いて、数量化2類を行って、そのモデルがただしいかをチェックしろと言われました。これは正しいのでしょうか?どうか教えてください。お願いします

お礼日時:2014/11/17 00:05

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!