dポイントプレゼントキャンペーン実施中!

統計分析初学者です。よろしくお願いいたします。

お聞きしたいのは、エクセルにおいて
回帰分析した結果の決定係数と散布図作成から近似曲線作成した場合の決定係数に違いがあるケースがあります。これはどう解釈したよいのかという質問です。近似曲線はもちろん線形で近似させています。マイクロソフトのサイトでは散布図からの近似曲線は最小2乗法によるとのことですので、縦軸と横軸を入れ替えても決定係数は変わらないと思っているのですが、このケースの場合変わってしまいます。ご存知の方がいましたら、是非教えていただきたいと思います。

<追記>
パワーポイント資料等で説明する際には、
やはり決定係数だけでなく、t値やP値も併記するべきなのでしょうか。
合わせて皆様の見解をお聞かせください。

よろしくお願いいたします。

A 回答 (1件)

ご質問1「決定係数に違いがあるケースがあります」



確かに、エクセルの回帰分析では、説明変数と被説明変数を入れ替えたとき、値が違うことがあります。

定数項と、そのほかに説明変数が1個あるモデルでは、理論上は、説明変数と被説明変数を入れ替えても決定係数は変わりません。ただ、次の例外があります。

[1] 説明変数が定数のとき
⇒ 本来の定数項と説明変数が共線関係になるため、回帰分析は不可能です。

[2] 被説明変数が定数のとき
⇒ 係数パラメータの推計は可能ですが、決定係数は計算できません。

[1]や[2]の場合は、本来、決定係数が存在しないはずなのに、エクセルでは、どういうわけか計算されてしまいます。また、厳密に定数でなくても、説明変数や被説明変数の変動が小さいときには、エクセルによる結果は、極めて不安定になります。そして、このようなケースのとき、上記のような現象が起きるようです。

ご質問2「t値やP値も併記するべきなのでしょうか」

下の理由により、t値またはP値を記載したほうが良いと思います。P値を記載すれば、t値を記載する必要性は薄いと思います。

[3] 決定係数は、F値とともに、推計式全体の当てはまりを見るために使われます。
[4] P値(or t値)は、個々の説明変数が効いているかどうかを見るために使われます。

説明変数が複数あるときは、[3]と[4]はまったく違った意味なので、[4]を記載するのが必須です。

説明変数が1個のときは、[3]と[4]は同様の意味なので、両方を記載する意味が乏しいとも言えるのですが、読み手が安心するという意味で、[3]と[4]を併記するのが望ましいと思います。
    • good
    • 0
この回答へのお礼

お礼が遅くなってしまい,申し訳ありません.
丁寧なご説明ありがとうございました.

お礼日時:2011/02/12 18:04

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!