この間r2について質問したのですが、その際はご回答ありがとうございました。
今回の質問は回帰分析でFやPは何を意味するのですか?その数字の大きさの意味についても教えて下さい!
お願いします。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

もうこの辺の話になると、説明するより本を読んでもらった方が早いです。

またその方がきちんと理解できます。時間がないのでしょうが申し訳ない。

「SASによる回帰分析」(東京大学出版)
が非常にわかりやすかったと思います。この著者に実際にお会いしたことがあるのですが、もし題名が
「一番わかる回帰分析」のような感じだったらベストセラーだったといっていました。その通り、非常に入門者向けにわかりやすく書いてある。

是非、参考にされてください。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Q相関分析の相関係数と重回帰分析の偏回帰係数の違いの説明

実は会社での説明に苦慮しています。
例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。
どなたかお知恵をいただきたく、よろしくお願いします。

Aベストアンサー

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チームの防御率をX1、チームの打率をx2、すなわち、説明変数を複数(2つ以上)採り、順位yの推定を行うのが、重回帰分析です。
 このように、単回帰分析よりも、重回帰分析の方が、必ず相関係数が高くなります。すなわち、結果の推定の確実性が増すわけです。相関係数が、1.0になれば、説明変数の事柄だけで、従属変数の事柄が決定できます。すなわち、100%的中します。

 単回帰では、防御率、打率とも、相互の影響は考慮されていません。従って、防御率と打率のどちらが影響力が強いのかは、相関係数から予測はできるものの、決定できません。選手をとる場合、同じ年俸を払うのに、ピッチャーとバッターのどちらを補強したら効果的かは、判断が困難です。
 このとき、どちらの影響が強いかを推定できるのが、重回帰分析です。そのために利用するのが、偏回帰係数ですが、変数の単位に左右されるので、注意を要するところです。

 「単回帰では、(1)(2)(3)のどれが最も効果的かは、判断できません」が答えでしょうか。
 釈迦に説法の点は、ご容赦を。
  

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チー...続きを読む

QExcel 分析ツールの回帰分析の分散分析表に関して

「有意F」と「P-値」が意味するところを教えてください。

Aベストアンサー

直感的にイメージしやすいように、ご説明申しあげます。
ので、統計学的な厳密さから言うと、
私の説明は間違いです。
(正しく理解したい場合は、他の方の回答を信頼してください)

Excel分析ツール回帰分析の場合、
「有意F」はF検定に基づくP値、
「P-値」はt検定に基づくP値で、どちらも確率を示しています。

まず「有意F」は、
「この回帰モデルは全体として全く意味がない」と断言できる確率です。
ですから、この値が小さければ小さいほど回帰モデルとしてはよく出来ている
と思ってください。

つぎに「P-値」は、
「この説明変数には応答変数を説明する力がない」と断言できる確率です。
ですから、この値が小さければ小さいほど、説明変数としては力がある
と思ってください。
(切片のP-値は意味のないものなので無視しましょう)

分析ツールの回帰分析は、単回帰分析(説明変数が1つ)に限られていますから、
「有意F」と「P-値」は必ず同じ値になります。(実際に数値で確認してみてください)

なお補足になりますが、
Excel分析ツール回帰分析で「P-値」が表示されている部分は、分散分析表ではありません。
「分散分析表」にあたる部分は回帰、残差、合計で示された3行だけです。

直感的にイメージしやすいように、ご説明申しあげます。
ので、統計学的な厳密さから言うと、
私の説明は間違いです。
(正しく理解したい場合は、他の方の回答を信頼してください)

Excel分析ツール回帰分析の場合、
「有意F」はF検定に基づくP値、
「P-値」はt検定に基づくP値で、どちらも確率を示しています。

まず「有意F」は、
「この回帰モデルは全体として全く意味がない」と断言できる確率です。
ですから、この値が小さければ小さいほど回帰モデルとしてはよく出来ている
と思ってください...続きを読む

Q重回帰分析の回帰係数について

重回帰モデル:Y = X b + ε の回帰係数の導出について調べているのですが,本やサイトによって,次の2通りの表現があります。
 b = (X'・X)^(-1)・X'・Y (I)
 b = Cxx^(-1)・Cxy (II)
ただし,'は転置,^(-1)は逆行列,・は積を表しています。また,CxxはXの分散共分散行列,CxyはXとYの共分散ベクトルです。

どうして(I)と(II)の表現はイコールになるのでしょうか?教えて頂ければ幸いです。

Aベストアンサー

簡単のために
n個の入力x_i, (i=1,...,n)がn+1個のパラメターb_i, (i=0,...n)で変換されるものとします.
y = b_0 + Σb_i*x_i
ただし,Σは(i=1,...,n)の総和演算です.j番目の観測量をy_jと書き,
y_jなる出力を生じるはずの入力をx_ijと書くとき,
y_j = b_0 + Σb_i*x_ij + e_j
が成立します.ここで,e_jはxとbで説明できない観測誤差です.
m個の観測量y_j, (j=1,...,m)からbの最小二乗の意味で最適な推定を行うには
y_jを縦に詰んだm*1ベクタY,
X =
[1 x_11 x_21 ... x_n1]
[1 x_12 x_22 ... x_n2]
[: : : ... : ]
[1 x_1m x_2m ... x_nm]
なるm*(n+1)行列X,
B = [b_0 b_1 ... b_n]'
なるn*1ベクタを用いて,
以下のm*1誤差ベクタのノルムの最小化問題を解けば良い事になります.
|| X*B - Y ||^2 -> min
この問題の解はXの列空間にBを直交射影したものをXの行空間に戻すことで得られます.
すなわち,以下の正規方程式の解です.
X'*X*B = X'*Y
m>nでXが列フルランク,等価的にX'*Xが正則であれば,解は
B = (X'*X)^(-1)*X'*Y
と書けます(上の表現).

下の表現に関しては参考URLをご覧下さい.

参考URL:http://case.f7.ems.okayama-u.ac.jp/statedu/hbw2-book/node4.html

簡単のために
n個の入力x_i, (i=1,...,n)がn+1個のパラメターb_i, (i=0,...n)で変換されるものとします.
y = b_0 + Σb_i*x_i
ただし,Σは(i=1,...,n)の総和演算です.j番目の観測量をy_jと書き,
y_jなる出力を生じるはずの入力をx_ijと書くとき,
y_j = b_0 + Σb_i*x_ij + e_j
が成立します.ここで,e_jはxとbで説明できない観測誤差です.
m個の観測量y_j, (j=1,...,m)からbの最小二乗の意味で最適な推定を行うには
y_jを縦に詰んだm*1ベクタY,
X =
[1 x_11 x_21 ... x_n1]
[1 x_12 x_22 ... x_n...続きを読む

Q線形回帰分析:多重共線性と主成分回帰について

 最小二乗法による線形回帰モデルのあてはめについて,説明変数間に多重共線性がある場合,回帰係数の信頼性や予測精度が低下すると習いました.これを防止する方法として,元の説明変数行列の主成分を説明変数としてあてはめを行う主成分回帰(PCR)等があるようです.

 しかし,説明変数行列の線形変換は,回帰モデルのあてはめ値(fitted values),残差,新たなデータに関する予測値に影響を与えません.主成分も線形変換の1つなので,元の説明変数と同数の主成分を説明変数に用いる場合,全く同じあてはめ値,残差,予測値が得られます.

それでは,主成分回帰は何故,多重共線性による回帰係数の信頼性,予測精度の低下を防止する手段と言えるのでしょうか?

(主成分回帰の狙いは,元の説明変数より少数の重要な主成分のみを説明変数に用いることにもあるようですが,これは,多重共線性の問題の防止とは関係ないと思います.)

勘違いしている点もあるかもしれないので,コメントを頂ければ嬉しいです。

Aベストアンサー

こんばんは.

指摘をいただきました部分は単純に書き損じです.
質問者様の指摘にあります通り,
正しくは,X = U*S*V' です.

お詫びというものでもありませんが,補足を行っておきます.
行空間と列空間はそれぞれ解の一意性と存在にかかわるものです.
任意の n * m 行列 y = X*a の方程式系について,
ベクタ y が X の列空間にある場合,等価的に X の列ベクタの線型和で書ける場合,系には解 a が存在します.
そうでない場合は, y から 「Xの列ベクタで書けない成分」を抜き取ります.
この「」の中身が残差であり,最小二乗法はこれが最小になるような修正を行います.
これは真っ直ぐ射影すること,X の列空間への直交射影で達成できます.
さて,修正した y (つまりXの列ベクタの線型和で書ける)に関する方程式 y_hat = X*a_hat の解が最小二乗解です.
ところで, X*b = 0 なる b が存在する場合(b は X の零空間といいます),
X*(a_hat+b) = X*a_hat + 0 = y_hat となってしまいます.
あるスカラー c に関して, X*(c*b) = c*(X*b) = 0 ですから,このような b が存在する場合,
最小二乗解は無数に存在することになります.
これは都合が悪いので,この無数の解のうち b をを含まないものを選択します.
b は X の行ベクタに直交することに注意すると,これは「X の行ベクタで書けない成分」の抜き取りですから,
先の議論同様 X の行空間への直交射影で達成できます.
まとめると,
(1) 左辺をXの列空間へ直交射影する (解を得るため)
(2) (1) で得た解をXの行空間へ直交射影する (解を一意に決めるため)
という作業で最小二乗解を確定します.
以上が X の 列ベクタと行ベクタそれぞれで張られる空間の基底が必要になる理由です.

説明変数が独立でない場合,n*m 行列 X のランクは m より小さくなります.
X のランクを l (l < m) と書くと, X の行ベクタで独立なものは l 本しかないので,
これらに直交する一次独立なベクタを m - l 本持ってこれます(上記の b が存在する).
結果として,(2) の作業が必要になり,求解に特異値分解が要求されるということになります.
このとき,X'*X は m*m 行列ですが,ランク l 行列の積であるため,そのランクも l であり,
逆行列が作れず普段の解法が使えない,と考えてもよいでしょう.

こんばんは.

指摘をいただきました部分は単純に書き損じです.
質問者様の指摘にあります通り,
正しくは,X = U*S*V' です.

お詫びというものでもありませんが,補足を行っておきます.
行空間と列空間はそれぞれ解の一意性と存在にかかわるものです.
任意の n * m 行列 y = X*a の方程式系について,
ベクタ y が X の列空間にある場合,等価的に X の列ベクタの線型和で書ける場合,系には解 a が存在します.
そうでない場合は, y から 「Xの列ベクタで書けない成分」を抜き取ります.
この...続きを読む

Q重回帰分析と分散分析

R≒0のとき、p値が有意であることは何を意味していますか
分散分析の帰無仮説は全ての係数が0であるですが、
Rがゼロに近いとき、p値が有意になることはありますか

持っているデータで回帰分析を行ったところ
R=0.11xx、R2=0.012xx、P<0.001xx

となりました。これは、相関がないことを示しているのでしょうか。
それとも弱いながらも相関があることを示しているのでしょうか。

よろしくお願いします。

Aベストアンサー

R, p は何を表わしていますか?

Rが残差を表す場合もありますので、記号の定義は自明のもの以外は説明要です。

Rが相関係数なら、相関ありとは言えないレベルではないでしょうか。

しかし、ことの正否を問うならデータ数とか判断に必要な緒元は与えられないと!


人気Q&Aランキング

おすすめ情報