プロが教える店舗&オフィスのセキュリティ対策術

【統計 回帰分析 ダミー変数について】回帰分析に曜日みたいなダミー変数を設定する場合って、ダミー変数は1つ少なくしても問題はないですか?

例えば、曜日だと、
月→1,0
火→1,0
水→1,0
木→1,0
金→1,0
土→1,0
日→1,0
のところ、

日→1,0
の部分を省いても、分析には問題ありませんよね?

A 回答 (1件)

問題ないどころか、そうすべきです。



古典的な重回帰分析において、ダミー変数を用いる回帰を数量化Ⅰ類と言いますが、最後の日曜日の列は作りません。

なぜなら、全ての7曜をワンホット・エンコーディングして01化すると、曜日の列間で、常に和が1となり線形制約が掛ってしまいます。

線形制約が掛ると、重回帰分析の偏回帰係数を解く式、

β=(XTX)^-1・XT・y

において、XTX行列のデターミナント値が0となり逆行列が解けなくなって破綻してしまいます。

データサイエンスで用いられるlasso(ラスー)のような正則化回帰であれば、7曜全てをワンホット・エンコーディングしても構いません。
    • good
    • 0
この回答へのお礼

ありがとうございます!
そうですよね。詳しいところまで教えていただきありがとうございました!!大変参考になりました。

お礼日時:2023/01/15 20:10

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!