No.4ベストアンサー
- 回答日時:
>被説明変数に影響がなさそうな説明変数ほど係数の絶対値が大きく、
必ずしもそうとは言えません。
xの係数(偏回帰係数という)の大きさや符号を考える上で,注意点が大きく分けて二つあります。
(1)
まず,単位の問題です。
これは回答者No3さんも指摘したとおりです。
例えば,
身長が1cm伸びたら体重が1kg増えた
というのと
身長が1cm伸びたら体重が1000g増えた
は,全く同じ現象です。
しかし,数学的には(数式上は),後者の増加率は前者の1000倍にもなります。
多変量解析では様々な単位の測定値を使うので,この点の注意が必要です。
(2)
次に,x(説明変数とか独立変数と呼ぶ)相互間の相関です。
これは分析に慣れた研究者でも忘れやすい点です。
回答者No3さんは
>(係数が)絶対値が大きいほど、yの値に影響
と述べましたが,この説明は誤解を与えます。
xを説明変数と述べましたが,これは,
yをどれだけ説明できるか,あるいは,どれだけ密接に結びついてるか
を調べるために計算された式だから,そう呼ぶのです。
それを検討するとき,
係数の絶対値が大きければ,より一層yと結びついてる
とは必ずしも言えません。
例えば,簡単のため2変数モデル(重回帰式)を考えます。
y=a*x1+b*x2
(a)
まず,次のような架空のデータを考えます。
yx1x2
115
328
534
746
1057
計算すると,
y = 2.19* x1 + 0.063* x2 -1.74
となります。
x1の係数が,ずっと大きいですね。
そこで,各xとyとの相関を計算すると,
x1とy,r = 0.996
x2とy,r = 0.226
であり,見事にx1の影響が大きいことが示されているようです(実際には,後述の分析が必要)。
(b)
次に,別のデータを考えます。
yx1x2
31.96
54.112
42.99
76.118
96.921
同様に計算すると,
y = -2.6* x1 + 1.3* x2 +0.32
となります。
ここでは,x1の係数の絶対値は,x2のそれの2倍あります。
では,x1 のほうがyを良く説明してるのでしょうか?
yとの相関を計算すると,
x1とy,r = 0.98
x2とy,r = 0.99
両方ともほとんど違わず,むしろx2のほうが,やや大きくなっています。
では,上の二つのデータ(a)と(b)のどこが違うのでしょうか?
説明変数相互間の相関を計算します。
(a) x1とx2,r = 0.2
(b) x1とx2,r = 0.998
実は,(b)は,x1とx2が相互に関連し合ってyに影響を与えていたのです。
だから,偏回帰係数の違いや大きさは,yに与える影響だけでなく,x相互間の影響も含んだものとなっているのです。
一方,(a)は,x1とx2の相互の影響が小さく,重回帰式がそのまま,各xがyに与える影響を反映しているのです。
前回指摘した問題点がここでも出てきました。
つまり,説明変数を多くすれば,それだけ,その相互間の影響も増えてくるのです。
x1, x2, x3
ならば,
x1 と x3
x2 と x3
x1 と x3
の相互間の影響を分析しなければなりません。
再度ご回答ありがとうございます。
(1)に関して、今扱っているデータは同じ単位なので問題ないですが、気をつけていないと忘れてしまいそうなのでこれも注意が必要ですね。
(2)-(b)は多重共線性が発生している状態ですよね。入力データに多少の変動を与えた場合に、係数ががんがん変わっていたのが、今思うとこれにあたるようですね。
多重共線性について勉強してみたのですが、とりあえず、多重共線性が発生している状態では回帰による結果が得られない、あるいは得られたとしても信頼性がなく、回帰に使うべきではないと言うことは分かりました。が、結局どんな現象が起きていて、何でだめなのかは分からず終いでした。
いろいろ教えていただいて、多変量解析は内容を知らないままソフトに任せていては危険だと言うことが今回よく分かりました。これから、勉強していこうと思います。
ご丁寧にどうもありがとうございました。
No.5
- 回答日時:
No3のデータが読みにくくなってしまいました。
(a)
y,x1,x2
1,1,5
3,2,8
5,3,4
7,4,6
10,5,7
(b)
y,x1,x2
3,1.9,6
5,4.1,12
4,2.9,9
7,6.1,18
9,6.9,21
No.3
- 回答日時:
>y =a0+ a11*x1 + a12*x1^2 + a13*x1^3 + ・・・
これなら、説明変数は、x1だけでなので、単回帰分析。エクセルで、多次式を選択できます。
x2が入ると、重回帰分析になりますが、多変数、しかも多次式のものは、今まで目にしたことはありません。式の説明・解釈が困難だと想います。重回帰分析は、多重共線性という私には理解不能の部分をクリアしないと、実際には間違った重回帰式になりますので、式を説明できないと、苦しいのでは。
重回帰式の係数については、絶対値が大きいほど、yの値に影響します。ただ、実際のデータの単位が、kgとgでこの係数が1000倍違ってきますので、それほど意味はないと判断しています。
変数の数を増やし、次数を増やすほど、決定係数は1に近づき、信頼性は増します。が、説明は難しい=理解できないのでは。例えば、y=a+bx+cx^2の式でさえ、cx^2なんぞは説明が出来ないので、やらないことにしています。
ご回答ありがとうございます。
>式の説明・解釈が困難だと想います。
確かに多重共線性もそうですが、ちゃんと現象を理解できないまま回帰を使うのは危険ですね・・・
No.2
- 回答日時:
単回帰でも、重回帰でも、同じツールで設定するようですが… ↓
http://www.ipc.shimane-u.ac.jp/food/kobayasi/mul …
エクセルでのやり方を数学カテゴリーで聞くのは、カテ違いですよ。
No.1
- 回答日時:
エクセルでは通常求まりません。
多変数多項式は,多変量解析となります。
ただし,3次以上にもなる多変数多項式は,実用的に意味があると思えないのですが・・
通常は,1次か,せいぜい2次です。
次数を増やせば増やすほど,変数を増やせば増やすほど,背後の現象と無関係になんでも説明できてしまうからです。
この場合,AIC(Akaike's Information Criteria,赤池の情報量基準)
http://aoki2.si.gunma-u.ac.jp/Yogoshu/1.html
などが,数式評価に用いられます。
ご回答ありがとうございます。
リンク先とても参考になりました。
つまり次数を増やしてしまうと、オーバーフィッティングになってしまって、モデル式がロバストではなくなってしまうと言うことですね。
統計に関して初心者なので、もう一点お聞きしたいのですが、例えば、
y = a0 + a1*x1 + a2*x2 + a3*x3
のような場合、回帰分析で求められる係数の大きさにはどのような意味があるのでしょうか。
説明変数(x1,x2,x3)と被説明変数(y)のそれぞれのデータの関係を見ると、
被説明変数に影響がなさそうな説明変数ほど係数の絶対値が大きく、
逆に影響が大きそうな説明変数ほど係数の絶対値が小さくなっているように感じます。
それぞれの項の影響度を同じにするように係数は決定されている、というようなイメージでいいのでしょうか。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 大学・短大 大学 統計学 2 2022/09/18 15:06
- 数学 環論 1 2022/04/12 14:08
- 数学 『因数に分解するということ』 9 2022/06/27 06:14
- 法学 特殊決議 (とくしゅけつぎ)について 2 2022/05/22 01:35
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 数学 数2の二項定理の問題です!教えてください! Q、次の展開式における【⠀】内の項の係数を求めよ。 (X 4 2023/02/18 11:42
- 数学 モデルのパラメータの定義がいまいちわかりません。 3 2022/10/11 15:16
- 数学 多項式の性質と無理数・有理数 2 2022/06/21 06:50
- 数学 群数列の問題がわかりません。どなたか教えてください… 【問題文】 1から順に自然数を並べて, 下のよ 2 2022/03/28 18:55
- 数学 多変数関数の微分とテイラー展開について 5 2022/04/24 16:55
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
前にも質問したのかもしれないけど
-
10の-9乗ってどういう意味ですか?
-
確率の問題で、「5人の中から3...
-
接線の方程式
-
線形代数の対称行列についての...
-
座標平面上での三角形の面積の...
-
関数の曲線の形状について
-
【至急!!】線形計画問題教えて...
-
二次関数の近似式を求めるため...
-
ラグランジュ乗数法~極大化の...
-
高低差のある支持点で,電線の...
-
線形代数に強い方、共線関係とは?
-
ナッシュ交渉解の求め方を教え...
-
プラスとマイナスが入った比率...
-
行列の式に関する質問です。 こ...
-
滴定の実験で、結果をExcelで一...
-
3000円が3割なら10割はいくらで...
-
効用関数?効用水準?無差別曲線?
-
シグマなど文字を含んだままで...
-
【 数A 場合の数 】 問題 10円...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
確率の問題で、「5人の中から3...
-
10の-9乗ってどういう意味ですか?
-
高低差のある支持点で,電線の...
-
高校数学Ⅰ・Aです。 2200の正の...
-
数学の問題で質問です。 行きは...
-
二点の座標から直線の方程式を...
-
数学得意な方!!!!!
-
【至急!!】線形計画問題教えて...
-
ばらつきの掛け算
-
KKT条件について教えてくだ...
-
半径1の円に内接する三角形の面...
-
線形代数に強い方、共線関係とは?
-
関数f(x1,x2,x3,x4,x5)が最大値...
-
線分と楕円が交差する条件
-
線形代数の対称行列についての...
-
一次独立系であることの証明 ...
-
log-logの補間式
-
制約つき最適化問題
-
写真のような分配ばねの等価ば...
-
再度、4点を通る曲線の方程式
おすすめ情報