dポイントプレゼントキャンペーン実施中!

y  =a0
+ a11*x1 + a12*x1^2 + a13*x1^3 + ・・・
+ a21*x2 + a22*x2^2 + a23*x2^3 + ・・・
     ・
     ・


上記のような多変数多項式の各係数をエクセル2007で求めようとしているのですが、
やり方がわかりません。

単変数や1次の多変数の係数は、LINEST関数や回帰解析ツールを使えば、
求められることが分かったのですが、多変数多項式の各係数はどのようにして求めるのでしょうか。

どなたかご教授いただけると助かります。

A 回答 (5件)

>被説明変数に影響がなさそうな説明変数ほど係数の絶対値が大きく、



必ずしもそうとは言えません。

xの係数(偏回帰係数という)の大きさや符号を考える上で,注意点が大きく分けて二つあります。

(1)
まず,単位の問題です。
これは回答者No3さんも指摘したとおりです。

例えば,
身長が1cm伸びたら体重が1kg増えた
というのと
身長が1cm伸びたら体重が1000g増えた
は,全く同じ現象です。

しかし,数学的には(数式上は),後者の増加率は前者の1000倍にもなります。

多変量解析では様々な単位の測定値を使うので,この点の注意が必要です。

(2)
次に,x(説明変数とか独立変数と呼ぶ)相互間の相関です。

これは分析に慣れた研究者でも忘れやすい点です。

回答者No3さんは
>(係数が)絶対値が大きいほど、yの値に影響
と述べましたが,この説明は誤解を与えます。

xを説明変数と述べましたが,これは,
yをどれだけ説明できるか,あるいは,どれだけ密接に結びついてるか
を調べるために計算された式だから,そう呼ぶのです。

それを検討するとき,
係数の絶対値が大きければ,より一層yと結びついてる
とは必ずしも言えません。

例えば,簡単のため2変数モデル(重回帰式)を考えます。
y=a*x1+b*x2

(a)
まず,次のような架空のデータを考えます。

yx1x2
115
328
534
746
1057

計算すると,
  y = 2.19* x1 + 0.063* x2 -1.74

となります。

x1の係数が,ずっと大きいですね。

そこで,各xとyとの相関を計算すると,

x1とy,r = 0.996
x2とy,r = 0.226

であり,見事にx1の影響が大きいことが示されているようです(実際には,後述の分析が必要)。

(b)
次に,別のデータを考えます。

yx1x2
31.96
54.112
42.99
76.118
96.921

同様に計算すると,
   y = -2.6* x1 + 1.3* x2 +0.32

となります。

ここでは,x1の係数の絶対値は,x2のそれの2倍あります。
では,x1 のほうがyを良く説明してるのでしょうか?

yとの相関を計算すると,

x1とy,r = 0.98
x2とy,r = 0.99

両方ともほとんど違わず,むしろx2のほうが,やや大きくなっています。

では,上の二つのデータ(a)と(b)のどこが違うのでしょうか?

説明変数相互間の相関を計算します。

(a) x1とx2,r = 0.2
(b) x1とx2,r = 0.998

実は,(b)は,x1とx2が相互に関連し合ってyに影響を与えていたのです。
だから,偏回帰係数の違いや大きさは,yに与える影響だけでなく,x相互間の影響も含んだものとなっているのです。

一方,(a)は,x1とx2の相互の影響が小さく,重回帰式がそのまま,各xがyに与える影響を反映しているのです。

前回指摘した問題点がここでも出てきました。

つまり,説明変数を多くすれば,それだけ,その相互間の影響も増えてくるのです。
x1, x2, x3
ならば,

x1 と x3
x2 と x3
x1 と x3

の相互間の影響を分析しなければなりません。
    • good
    • 0
この回答へのお礼

再度ご回答ありがとうございます。

(1)に関して、今扱っているデータは同じ単位なので問題ないですが、気をつけていないと忘れてしまいそうなのでこれも注意が必要ですね。

(2)-(b)は多重共線性が発生している状態ですよね。入力データに多少の変動を与えた場合に、係数ががんがん変わっていたのが、今思うとこれにあたるようですね。

多重共線性について勉強してみたのですが、とりあえず、多重共線性が発生している状態では回帰による結果が得られない、あるいは得られたとしても信頼性がなく、回帰に使うべきではないと言うことは分かりました。が、結局どんな現象が起きていて、何でだめなのかは分からず終いでした。

いろいろ教えていただいて、多変量解析は内容を知らないままソフトに任せていては危険だと言うことが今回よく分かりました。これから、勉強していこうと思います。

ご丁寧にどうもありがとうございました。

お礼日時:2011/04/21 00:25

No3のデータが読みにくくなってしまいました。



(a)
y,x1,x2
1,1,5
3,2,8
5,3,4
7,4,6
10,5,7

(b)
y,x1,x2
3,1.9,6
5,4.1,12
4,2.9,9
7,6.1,18
9,6.9,21
    • good
    • 1

>y  =a0+ a11*x1 + a12*x1^2 + a13*x1^3 + ・・・


これなら、説明変数は、x1だけでなので、単回帰分析。エクセルで、多次式を選択できます。
x2が入ると、重回帰分析になりますが、多変数、しかも多次式のものは、今まで目にしたことはありません。式の説明・解釈が困難だと想います。重回帰分析は、多重共線性という私には理解不能の部分をクリアしないと、実際には間違った重回帰式になりますので、式を説明できないと、苦しいのでは。

 重回帰式の係数については、絶対値が大きいほど、yの値に影響します。ただ、実際のデータの単位が、kgとgでこの係数が1000倍違ってきますので、それほど意味はないと判断しています。

 変数の数を増やし、次数を増やすほど、決定係数は1に近づき、信頼性は増します。が、説明は難しい=理解できないのでは。例えば、y=a+bx+cx^2の式でさえ、cx^2なんぞは説明が出来ないので、やらないことにしています。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。

>式の説明・解釈が困難だと想います。
確かに多重共線性もそうですが、ちゃんと現象を理解できないまま回帰を使うのは危険ですね・・・

お礼日時:2011/04/20 23:32

単回帰でも、重回帰でも、同じツールで設定するようですが… ↓


http://www.ipc.shimane-u.ac.jp/food/kobayasi/mul …
エクセルでのやり方を数学カテゴリーで聞くのは、カテ違いですよ。
    • good
    • 0
この回答へのお礼

失礼しました。

お礼日時:2011/04/15 00:43

エクセルでは通常求まりません。



多変数多項式は,多変量解析となります。

ただし,3次以上にもなる多変数多項式は,実用的に意味があると思えないのですが・・

通常は,1次か,せいぜい2次です。

次数を増やせば増やすほど,変数を増やせば増やすほど,背後の現象と無関係になんでも説明できてしまうからです。

この場合,AIC(Akaike's Information Criteria,赤池の情報量基準)
http://aoki2.si.gunma-u.ac.jp/Yogoshu/1.html
などが,数式評価に用いられます。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。

リンク先とても参考になりました。
つまり次数を増やしてしまうと、オーバーフィッティングになってしまって、モデル式がロバストではなくなってしまうと言うことですね。

統計に関して初心者なので、もう一点お聞きしたいのですが、例えば、

y = a0 + a1*x1 + a2*x2 + a3*x3

のような場合、回帰分析で求められる係数の大きさにはどのような意味があるのでしょうか。

説明変数(x1,x2,x3)と被説明変数(y)のそれぞれのデータの関係を見ると、
被説明変数に影響がなさそうな説明変数ほど係数の絶対値が大きく、
逆に影響が大きそうな説明変数ほど係数の絶対値が小さくなっているように感じます。

それぞれの項の影響度を同じにするように係数は決定されている、というようなイメージでいいのでしょうか。

お礼日時:2011/04/15 00:42

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!