gooドクター有料プランが1ヶ月間無料!

実は会社での説明に苦慮しています。
例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。
どなたかお知恵をいただきたく、よろしくお願いします。

gooドクター

A 回答 (3件)

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。


 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チームの防御率をX1、チームの打率をx2、すなわち、説明変数を複数(2つ以上)採り、順位yの推定を行うのが、重回帰分析です。
 このように、単回帰分析よりも、重回帰分析の方が、必ず相関係数が高くなります。すなわち、結果の推定の確実性が増すわけです。相関係数が、1.0になれば、説明変数の事柄だけで、従属変数の事柄が決定できます。すなわち、100%的中します。

 単回帰では、防御率、打率とも、相互の影響は考慮されていません。従って、防御率と打率のどちらが影響力が強いのかは、相関係数から予測はできるものの、決定できません。選手をとる場合、同じ年俸を払うのに、ピッチャーとバッターのどちらを補強したら効果的かは、判断が困難です。
 このとき、どちらの影響が強いかを推定できるのが、重回帰分析です。そのために利用するのが、偏回帰係数ですが、変数の単位に左右されるので、注意を要するところです。

 「単回帰では、(1)(2)(3)のどれが最も効果的かは、判断できません」が答えでしょうか。
 釈迦に説法の点は、ご容赦を。
  
    • good
    • 0
この回答へのお礼

わかりやすい例えでご説明いただき、ありがとうございます。そのまま引用させてもらいたいところですが、もう一度自分で整理したいと思います。

お礼日時:2004/11/04 13:26

こんにちは.相関係数と偏回帰係数の違いのご質問ですね?



この質問に答えるためには,(1)相関係数/回帰係数の違い,(2)「偏」あり/「偏」なし,に分解して考える必要があります.

────────────────────────────
X 061 072 084 095 097 098 100 113 126 130
Y 083 082 099 096 115 108 095 111 114 135
────────────────────────────

(1)相関係数/回帰係数
上記のXとYのデータがあります.Excelなどの表計算で実際に相関係数や回帰係数で求めてみましょう.

回帰係数とは,回帰式の「傾き」のことですが,Excel関数「=SLOPE(範囲1, 範囲2)」を,そして相関係数はExcel関数「=PEARSON(範囲1, 範囲2)」使うことで算出できます.
さて,回帰係数と相関係数は,二変数の関係性ですので,実際に範囲1と範囲2に,「X」と「Y」のデータを代入してみましょう.

<回帰係数>
範囲1=X,範囲2=Yの場合(X→Y) 回帰係数 1.19
範囲1=Y,範囲2=Xの場合(Y→X) 回帰係数 0.65

<相関係数>
範囲1=X,範囲2=Yの場合(X-Y) 相関係数 0.88
範囲1=Y,範囲2=Xの場合(Y-X) 相関係数 0.88

統計学を勉強されている方は今更でしょうが,回帰係数は,同じXとYのデータを使う場合でも,範囲1と範囲2のいずれにXとYを設定するかで係数の値が異なります.相関係数の場合は,変わりません.これは,回帰係数の場合は,「X→Y」あるいは「Y→X」という方向性が重要になるため,どちらの方向性の回帰係数かによって異なる数値がでるわけです.

そうすると,「X→Y」の回帰係数とは,XからYへの影響性を,「Y→X」の回帰係数とは,YからXへの影響性を意味しています.では,両方向の影響性を平均して,XとYとの間の(両方向の)影響性を求めてみましょう.
普通の(算術)平均ではなく,掛け算の後ルート計算をするという幾何平均を行ってみます.

√(0.65×1.19)=0.88

この「0.88」という数値どこかで見覚えはありませんか? そう,「XとY」との間の【相関係数】と同値です.実は,XとYの相関係数とは,X→Yの回帰係数とY→Xの回帰係数の(幾何)平均を意味しています.

このように考えると,

回帰係数:方向性のある影響力
相関係数:双方向の影響力を平均した総合的類似度指標

と,考えることができます.

(2)「偏」あり/「偏」なし
相関係数であれ,回帰係数であれ,普通の相関係数/回帰係数の他に,偏相関係数/偏回帰係数というものがあります.「偏」というのは何かというと,一般の人々にわかりやすく言えば「純粋な」と言い換えても大きな間違いではないでしょう.
そうすると,普通の相関係数や回帰係数などの「偏」がついていないものは,純粋ではない相関/回帰係数ということを意味します.相関であれ,回帰であれ,二変数の関係性の指標ですが,実は,それ以外の変数の要素が混在している可能性が除去できないのです.


 事柄A ←直接的関係→ 事柄B
  ↑           ↑ ┐
  │           │ │間接的関係
  └─── 事柄C ───┘ ┘

 ※図表がずれている場合は,コピー&ペーストの等幅フォントで対応して下さい

この図のように,AとBとの間に,Cの要素が仲介して関係性を与えている【可能性もありえる】のです.普通の相関係数は「直接的関係+間接的関係」の療法を含んでいることになります.
この間接的関係を削除した部分,つまりは直接的関係が,「純粋な=偏」相関/回帰係数ということになります.


以上のことを踏まえて,普通の相関係数を求めた場合と,重回帰分析を使った偏回帰係数では何が違うか……もうおわかりですね?
No1さんやNo2さんの回答と合わせて参考にして下さい.
    • good
    • 5
この回答へのお礼

ご回答いただき、ありがとうございます。非常に詳細な説明で、よく理解できました。自分自身の勉強にもなりました。

お礼日時:2004/11/04 13:29

(1)・(2)・(3)の相互作用がある場合は、単回帰を複数


行っても正確な判定を下せません。

例えば、特定のメーカーは、特定のデザインが多い
という傾向がある場合に、単回帰を行い、
メーカーA→購入意欲高い
デザインA→購入意欲高い
という結果がでたとしても、

メーカーA→デザインAが多い→購入意欲高い
という関係が存在すると、メーカのために購入意欲が
高いのか、デザインのために購入意欲が高いのか分離
することができません。本当はデザインよりも、メー
カーのネームバリューで売れていたとしても、偽の関
係によって、デザインでも強い相関がでたりします。

このようなとき、それぞれの因子を分離したい場合、
多変量を用いる方が正確といえます。

文章で説明するのは、むずかしいですが、いかがでしょう?

参考URL:http://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/arc …
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
言葉での説明はなかなか難しいと思いますが、参考になりました。

お礼日時:2004/11/04 13:23

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


人気Q&Aランキング