プロが教える店舗&オフィスのセキュリティ対策術

重回帰モデルのダミー変数について類似の質問も読んでみたんですが、初心者なので分かり易く教えて頂けたら嬉しいです。

よく男性と女性で0と1を使ったりしますが、
例えば文学部4年までを、1年・2年・3年・4年生の4つで調べたい場合に教科書を読むと、「2つ以上のカテゴリーが存在する場合にもダミー変数を用いることができる。これは想像を絶するよりもずっと扱いが難しく、必要な場合には専門書を参照するべきである。」と書かれてました。(なので1年と4年の2つで調べようかと思うんですが。)
何がどう難しくなるのか、統計は苦手なので、できるだけ分かり易く教えて頂けたら嬉しいです。

A 回答 (1件)

たぶん、そのように書かれていたのは「昔の教科書」だからではないでしょうかね。

すくなくとも今ではコンピュータが普及しているので簡単にできます(というか、当たり前のように使われています)。それで、何が難しいのかというと、要するに計算が面倒ということですね(^_^;)

統計解析システム(例えばRとか)ではダミー変数を作成しなくても、1学年=1、2学年=2、3学年=3、4学年=4といったように整数値で表現した場合であっても、それがカテゴリカル型の変数であることを指定してあげれば、通常の重回帰分析のように分析できます。

# これは学年を表すデータベクトル
> gakunen <- c(1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4)
> gakunen <- as.factor(gakunen) # カテゴリカル型の変数として指定
# 身長データ
> shincyo <- c(160, 167, 159, 171, 173, 168, 180, 173, 169, 181, 179, 170)
> result <- lm(shincyo ~ gakunen) # 身長を学年で説明するモデル
> summary(result) # 結果の表示

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 162.000 2.749 58.936 7.63e-12 ***
gakunen2 8.667 3.887 2.229 0.05634 .
gakunen3 12.000 3.887 3.087 0.01496 *
gakunen4 14.667 3.887 3.773 0.00544 **
    • good
    • 0
この回答へのお礼

さっそくのお返事ありがとうございます。
大変参考になりました。
この度は本当に助かりました。ありがとうございます

お礼日時:2008/02/02 22:41

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!