アプリ版:「スタンプのみでお礼する」機能のリリースについて

量的変数(年齢)とダミー変数(性別)を説明変数とした重回帰分析をする場合(正確には共分散分析でしょうか?),多重共線性を回避するために,解析前におけるデータの「中心化」が推奨されていますが,量的変数の中心化については分かりますが,ダミー変数を中心化する意味はあるのでしょうか?
ダミー変数は中心化すべきなのでしょうか?

また,重回帰分析において中心化する意味として,上述した「多重共線性の回避」以外に何があるのでしょうか?

詳しい方がおられましたら,是非ご教示ください。
よろしくお願いいたします。

A 回答 (2件)

 一般論として、最小二乗法(又は最尤法)による線形回帰で、定数項を含むモデルの場合、中心化(元の変数の代わりに、その変数からから平均値を差し引いたものを変数として用いること)は、推計の精度に何の効果もありません。

この場合、多重共線性を回避する効果も、まったくありません。

 中心化の意味があるかもしれないケースとして考えられるのは、次のようなものでしょうか。

  (1) 線形回帰でない場合(交互作用項を用いる場合を含む)
  (2) 最小二乗法や最尤法でない場合
  (3) 定数項を含まないモデルの場合
  (4) 変数の桁数の割に変動が少なくて、中心化した方がコンピュータの桁落ちの可能性や丸め誤差が小さくなる場合

 ダミー変数の場合、(1)のケースは、ちょっと考えにくいことです。(2)のケースは、可能性として挙げましたが、実際に中心化が意味を持つ場合が本当に存在するのか、断言できません。
 ご質問のケースがどのようなものか分かりませんが、もし、(3)や(4)のケースに該当するなら、中心化する意味があるかもしれません。

この回答への補足

ご回答ありがとうございました。

なるほど…
中心化に多重共線性の回避効果はないのですね。

ただ,切片(定数)の解釈をしやすくするため(適正な全体平均の抽出)
中心化はある程度効果的なのかなぁ…と思っています。
が,この場合,質問した通り,「ダミー変数」も中心化すべきなのか
どうかが不明です。

とれる選択肢は以下の3つのように思っています。
(1)ダミー変数は中心化しない(量的変数のみ中心化する)
(2)ダミー変数も中心化する
(3)ダミー変数の「0」を「-1」に置換する
 (要は平均を「0」とするようにセンタリング)

ネットで調べてみると様々な意見があり,(1)も(2)もみられましたが,
論文等では(1)の方法を採用しているものが多いように思えます。

で,結局のところどのようにすればよいのか分からず混乱しております。

もし,アドバイスしていただければお願いいたします。

補足日時:2012/12/18 20:11
    • good
    • 0

 中心化してもしなくても本質的な違いがあるとも思えないので、どの方法をとるかは、結果を解釈するのにどれが分かりやすいか、という程度のことでしょう。


 要するに趣味の問題です。個人的な趣味から言えば、無駄な作業をしない方が論文も短くて済むので、回帰分析では(量的変数を含めて)中心化しない方法を選びます。これまで、その方法で不都合が生じたことはありません。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!