二つの変数があり、各々従属変数に対して単回帰分析を行うと決定係数が0.5と0.4ぐらいの感じになります。この二つの変数をくっつけてもう少し精度を上げたいのですが、一方は線形なんですが、もう片方が非線形(指数関数)なのです。
たしか、重回帰分析は線形どうしでしかくっつけることができなかったような気がするのですが、どのようにしたらできるでしょうか?
混合モデルとかを使ったらよいのでしょうか???
理論的に考えると
Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです
Yが従属変数X1,X2が変数、a,b,cがそれぞれ係数です。
使用できるソフトはSPSS,SAS,mintab,S-plus,R,excelです。Rでのが使い慣れているのでRでできるとよいのですが、できるならどのソフトでもかまいません。
No.2
- 回答日時:
質問の式についてですが,
Y,X1,X2は手元にある実測値
a,b,cを求める問題と解釈してもよろしいでしょうか?
まず,
b*exp(c*X2)
についてですが
b*exp(c*X2)=b*exp(c)*exp(X2)
ですから
定数cをおく必要はありませんね.
b*exp(X2)と考えます.
非線形~についてですが,変数X3を導入して
X3=X1*exp(X2)
とすれば
上の式は
Y=a*X1+b*X3
で線形の式になり普通に重回帰分析できると思います.
この回答への補足
早速返答、ありがとうございます。
おーと思ってやってみたのですが、いまいちうまくできません。
期待通りになってくれていません。
数学的に見る限り間違っていないと思うのですが。
> 質問の式についてですが,Y,X1,X2は手元にある実測値
> a,b,cを求める問題と解釈してもよろしいでしょうか?
ハイその通りです。
通常指数関数の単回帰をするときlog(Y)=aXとしてやりますよね。
ご指摘の通りはじめにexp(X)としやるのと比べると結果がぜんぜん違ってしまいます。
これが全く向上が見られない理由に思います。
今気付いたのですが
b*exp(c*X2)=b*exp(c)*exp(X2)
は間違いで
exp(c+X)=exp(c)*exp(X)ではないのでしょうか?
No.3
- 回答日時:
結論からいうと、ご質問のような操作をしても決定係数や精度が劇的に上がる保証はありません。
むしろ、多重共線性など別の問題を引き起こしそうですね。一般に
y = a + b x1 + u
というモデルに変数を加えて
y = a + b x1 + c x2 + u
というモデルを推定するとします。すると決定係数は上昇しますが、その上昇分は x1 と x2 を単回帰した時のそれよりも小さくなります。これは x1 と x2 に相関があるからです。相関が高いほど相関係数の上昇分は小さくなります。
一度、変数間の相関係数を調べてみてはいかがでしょうか。
因みに。
最小自乗法を用いた場合、
y = a + b x1
の回帰残差 e を考え、
e = c x2
とした回帰残差 v を考えると、この v は
y = a + b x1 + c x2
から得られた回帰残差に一致します。
したがって、変数を加えるということは、他の変数で説明されていなかった部分を説明する、という意味であることが分かります。
逆に言えば、変数を加えても精度があまり上がらないということは、加えた変数に新しい情報があまりない、ということになるでしょう。
No.4
- 回答日時:
すいませんでした.
基本なのになぜ気がつかないないのだろうと
疑問を感じながら回答しましたが
こちらが勘違いしていたみたいです.
余計な手間を取らせてしまって申し訳ないです.
新しい方法ですが
cを仮定して見てはいかがでしょうか.
cを仮定すればX3の導入はできると思います.
自分で適当においたcをつかって重回帰分析を行い求めたYと,
実測値Yの差の2乗和が最小のときのcを用いれば係数cの決定もできると思います.
モデルの妥当性を議論するには向かないかもしれませんが、
式を求めるだけならこれでもいけそうな気がします.
統計的に正しいのかどうかは自信がないですが
参考になれば.
No.5
- 回答日時:
> 理論的に考えると
> Y=aX1 + bexp(cX2) かY=aX1 + bX1exp(cX2)と思うのです
ということであれば、その理論式を使うべきです。そのデータを集めた実分野の理論的、実験的バックグラウンドに基づく情報は尊重すべきです。分析の結果、理論式がデータをうまく説明できるかどうか評価する判断の根拠を与えるものにはなっても、実際的な意味を無視して統計が独り歩きしては本末転倒です。
上式は変数変換してもパラメータに関して線形な形にはできませんので、非線形回帰分析を行ってください。SAS では proc nlin で、 S-plus では(ということは R も? 未確認…)nls 関数をつかって実行できます。SPSS, minitab は知りません。最小二乗解でパラメータの推定値を得るだけなら、精度はあまり良くありませんが Excel でもソルバーを使うとできます。非線形回帰分析について書いてある SAS と S-plus の参考書を下記に挙げておきます。
線形回帰と比べて、もちろん独特な部分はありますが、それほど難しくなるわけではありません(計算は桁違いに難しいですが、人間がやるわけではありませんから…)。ぜひ使ってみてください。
> 混合モデルとかを使ったらよいのでしょうか???
混合モデルは線形モデルの一種で、モデルの一部のパラメータを確率変数(変量効果)と考えるものですので、今回の場合は適当ではありません。
参考書
竹内啓監修,SAS による回帰分析,東京大学出版会
W.N.Venables, B.D.Ripley 著,S-plus による統計解析,シュプリンガー・フェアラーク東京
この回答への補足
>上式は変数変換してもパラメータに関して線形な形にはできませんので、非線形回帰分析を行ってください。
いろいろやっているうちに、自分でもいろいろひらめいて、自分の中でとても満足いく結果が出たのですが、これが数学的に正しいことをやっているのかが不安があります。
本題とは少しずれてしまうかもしれませんが、exp(x)をテイラー展開(?)して多項式に変換してもよろしいのでしょうか?
できました!!! Rのnlsには非線形回帰分析となっていたしこれでいけると思います。
しかし、ひとつ困ったことが、決定係数みたいな、どれだけフィットしているのは何を見ればいいのでしょう?residual sum-of-squaresでいいのですか?
No.6ベストアンサー
- 回答日時:
#5 です。
> exp(x)をテイラー展開(?)して多項式に変換してもよろしいのでしょうか?
示された式は exp(cX2) かと思いますので、テイラー展開しても c の非線形項は出てくるのでは? c について 1 次の項までしかとらなければ、結局線形回帰と同じこと(つまり exp() の意味がなくなる)かと…。
> 決定係数みたいな、どれだけフィットしているのは何を見ればいいのでしょう?
非線形回帰には線形回帰の R^2 のような単純に説明率と解釈できるような指標はありません。R^2 を拡張したものは一応あります。Nagelkerke の R^2 を調べてみてください。いずれにせよ S-plus (R) の nls 関数ではモデルの適合度や有意性関連の指標は出してくれないようですので、必要なら自分で計算するしかないようです。
ただ、誤差に正規分布を仮定するモデルなら、Residual sum of square が Deviance 統計量および Pearson chi square 統計量になりますので、帰無仮説 H0:このモデルはデータを説明できる、の下で、d.f. = n - p ( p はモデルのパラメータ数)のχ^2 分布に従うことを利用できます。
遅くなって申し訳ありません。無事できました。これでまとめて終われます。
コメントを下さった皆様ありがとうございました。この場を借りてお礼を申し上げたいと思います。
(日本語、間違っていたらすみません)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 心理学 満足度調査の回帰分析 0 2023/05/11 08:39
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 数学 モデルのパラメータの定義がいまいちわかりません。 3 2022/10/11 15:16
- 統計学 ダミー変数の因子分析について質問です 1 2022/03/27 14:31
- 数学 数学の教科書について 3 2023/01/29 21:10
- 統計学 マルチレベル分析について 2 2023/02/21 09:36
- 物理学 量子力学 球面調和関数 導出 方位角成分 微分方程式の解 2 2022/07/02 13:40
- 統計学 回帰分析検証不一致 5 2022/05/04 20:48
- 数学 「FFTの基本は、DFTはサンプル数Nが偶数なら 2つのDFTに分解できるということ。 分解するとD 3 2022/03/31 21:01
- 大学・短大 大学 統計学 2 2022/09/18 15:06
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
決定係数がマイナスになる例っ...
-
回帰式と近似式について
-
相関分析と回帰分析ではどのよ...
-
切片あり回帰と切片なし回帰
-
EXCELで両対数を取った重回帰分...
-
重回帰分析の説明変数の対数化...
-
線形相関係数
-
残差について
-
統計用語の和訳について
-
ある1点で傾きが急激に変化する...
-
統計学の多変量解析の考え方で...
-
統計ソフトStata17SEにおけるリ...
-
統計学? 相関関係のうち、因...
-
非線形回帰分析の定義が分かり...
-
回帰分析における変数変換と回...
-
Yハットの出し方やミュートと...
-
回帰式や指数曲線・・??
-
重回帰分析・ヘドニックアプローチ
-
統計用語?
-
ロジスティック回帰式について...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
決定係数がマイナスになる例っ...
-
切片あり回帰と切片なし回帰
-
ある1点で傾きが急激に変化する...
-
回帰式と近似式について
-
修正済み決定係数(R2乗)がマ...
-
原点強制通過させたときの相関係数
-
回帰水を売ってる会社大丈夫か
-
EXCELで両対数を取った重回帰分...
-
残差について
-
Yハットの出し方やミュートと...
-
重回帰分析で偏回帰係数を全て...
-
numbersで重回帰分析をしたい
-
エクセル 重回帰 グラフ
-
重回帰分析・ヘドニックアプローチ
-
原点を通る重回帰式について
-
重回帰分析をし、コントロール...
-
線形方程式の解法(数値計算)...
-
相関分析の相関係数と重回帰分...
-
複素数同士の回帰式をエクセル...
-
散布図からの近似曲線の書き方...
おすすめ情報