プロが教える店舗&オフィスのセキュリティ対策術

現在海外の大学で、今学期社会調査のコースをとっています。
先日、重回帰分析を学んだのですが、頭がついていかず、まったくわかりませんでした。どなたか、わかりやすく説明していただけないでしょうか?
日本語のサイトをさらってみたのですが、まだよくわかりません。

重回帰分析は、複数の従属変数dependent variablesと独立変数dependent variableの相関を調べるためにあるのだと解釈しています。
例にだされた、モデルが以下のようなものとなっています。
二酸化炭素の排出量に関するもでるです。


              モデル1  モデル2  モデル3
定数            -0,019 -0,244 -0.790
電気消費   2.315*** 2.296*** 2.293***
都市よりかどうか        0.004 0.007
人口の伸び 0.349

R-squared 0.908 0.910 0.911

*Siginificant at p< .05
**Siginificant at p< .01
***Siginificant at p< .001

この表の場合、二酸化炭素消費が従属変数になり、電気消費・都市よりかどうか・人口成長率が従属変数になるのだと思います。
相関度が強いのは、モデル1、2、3いずれも電気消費となっているのだと思います。
R-squaredを調べてみたところ、決定係数/寄与率と説明してありましたが、よくわかりません。また、モデル1、2、3とありますが、どのようにモデルは決定されるのでしょうか?

英語を翻訳して記しているので、多少ニュアンスの間違い等あると思います。また、グラフがずれて表示されよみにくくなっているかもしれません。すみません。

よろしくお願いします。

A 回答 (2件)

> 回帰式によりどれだけ説明できるかということは、その表自体が線グラフで示されている場合、そのせんグラフにどれだけ当てはまるかを示すものだということでしょうか?



「その表自体が線グラフで示されている」というのが良くわかりませんが、大雑把な言い方をさせてもらえば、回帰式から推定された排出量と実際に得られた排出量との差が小さいということです。
参考書等で正確なところを確認されるのが一番良いのですが、わかりにくければ補足に記載してください。

> また、定数のモデル1、モデル2、モデル3と値がマイナスになっていますが、マイナスの値の意味するものは何なのでしょうか?

二酸化炭素の排出量はマイナスになることはないでしょう。
たとえマイナスになることがあるとしても、定数項は有意でないので0として考えてよいでしょう。

> このグラフから分析をするとしたら、いずれのモデルの場合も、二酸化炭素消費は電気消費と密接な関係があり、その他の独立変数はあまり意をなさないということでいいのでしょうか?

そういうことになります。
二酸化炭素の排出量は電気消費だけでほぼ決まってしまうということです。
    • good
    • 0
この回答へのお礼

ありがとうございます!quaestioさんのおかげで大分わかってきました。
表をよみとることができるようになれば、多くのことを一度に解釈できるようになると思います。

データの解釈の仕方についてなのですが、別のトピックで質問をだしています。もしよろしければ、解答お願いしてもよろしいでしょうか?
http://oshiete1.goo.ne.jp/qa5252441.html

お礼日時:2009/09/01 22:18

> 重回帰分析は、複数の従属変数dependent variablesと独立変数dependent variableの相関を調べるためにあるのだと解釈しています。



書き間違いでしょうか? 逆になっていますね。
複数の独立変数に対して一つの従属変数の関係を調べるためにあります。

従って、

> この表の場合、二酸化炭素消費が従属変数になり、電気消費・都市よりかどうか・人口成長率が従属変数になるのだと思います。

も電気消費、都市よりかどうか、人口の伸びが独立変数となります。

> モデル1、2、3とありますが、どのようにモデルは決定されるのでしょうか?

変数の選択方法には、最初に全ての変数を使ったモデルから寄与の少なそうな変数を除いていく変数減少法、定数項のみから変数を増やしていく変数増加法、途中変数を増やしたり減少させたりする変数増減法があります。さらに選択の際に使う指標もF値を使う方法やAICを用いる方法があります。
ご質問で示されているものがどの方法を用いているのかは私にはわかりません。

> R-squaredを調べてみたところ、決定係数/寄与率と説明してありましたが、よくわかりません。

従属変数の値の変動を回帰式によりどれだけ説明できるかを表しています。
つまり、R-squaredが0.5なら従属変数の値の変動は回帰式により半分は説明できるということです。
明らかに関係ない変数でも組み込むと寄与率が高くなりますので、変数選択が必要になります。
(変数を全て使った場合が寄与率が最も高くなります)
    • good
    • 0
この回答へのお礼

早急の返答ありがとうございます。
表がずれているようで、見にくくなってしまっていて申し訳ありません。
従属変数、独立変数、書き方が逆になっていたようです。
モデルの決定、R-squaredの説明ありがとうございました。
回帰式によりどれだけ説明できるかということは、その表自体が線グラフで示されている場合、そのせんグラフにどれだけ当てはまるかを示すものだということでしょうか?

また、定数のモデル1、モデル2、モデル3と値がマイナスになっていますが、マイナスの値の意味するものは何なのでしょうか?

このグラフから分析をするとしたら、いずれのモデルの場合も、二酸化炭素消費は電気消費と密接な関係があり、その他の独立変数はあまり意をなさないということでいいのでしょうか?

たびたび質問すみません。

お礼日時:2009/08/31 14:44

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!