アプリ版:「スタンプのみでお礼する」機能のリリースについて

過去の統計検定の問題なんですがよくわかりません。

給与と学歴の関係を調べるため,次の単回帰モデルを考える。
log (wage) = β0 + β1(educ) + ε (1)
ここで,wage は 1 時間当たりの給与額(ドル/hour),educ は学歴(在学年数:たとえば,
高校卒では 6 + 3 + 3 = 12,大学卒では 6 + 3 + 3 + 4 = 16,修士課程卒では 6 + 3 + 3 + 4
+ 2= 18,博士課程卒では 6 + 3 + 3 + 4 + 2+ 3= 21)である。526 人の労働者を対象にして
データを集め,パラメータβ0 および β1 の最小二乗推定値 b0, b1 を求めたところ,以下の
結果が得られた(カッコ内は標準誤差)。このとき,以下の各問に答えよ。
b0 = 0.584 (0.0973), b1 = 0.0827 (0.00757)
決定係数 R2 = 0.186
〔1〕 帰無仮説 H0 : β1 = 0 を対立仮説 H1 : β1 > 0 に対して有意水準 5%で検定し,その
結果を述べなさい。
〔2〕 回帰係数 β1 の信頼度 95%の信頼区間を求めよ。
〔3〕 高校卒の人が大学に進学し,4 年の学士課程を卒業したとすれば,給与は高校卒の
場合と比べどのように変化すると予想されるかを答えよ。

A 回答 (1件)

企業でSQCを推進する立場の者です。

博士(工学)です。

(1)について回答します。(2)はそれから類推すれば解けます。(3)は代入問題です。
(1)については、ネットや参考書を見ても分からないんだなあ、と思いましたので、それよりは丁寧に書きます。

回帰係数bの検定は、b=0が帰無仮説、b>0が対立仮説です。
ただし、直線関係を前提としています。直線関係を見るならLOF(Lack of Fit)の検定をすべきですが、今の情報ではできません。

検定統計量は、to=b/SEb です。片側検定です。

今回は、ご丁寧にSEbが書いてありますので、もう、それで完了です。

to=0.0827 / 0.00757 = 10.9247

それでは勉強になりませんので、もう少し解説させて下さい。
SEbは回帰係数bの標準誤差です。

SEb={(Syy-Sxy^2/Sxx)/(n-2)Sxx}^1/2

これは、yの全変動から回帰変動(回帰による依存分)を引いて、それを自由度とxの変動で基準化したものです。

これをtoに代入し、既知であるr^2に置き換えてtoを計算します。

to=b×{(n-2)Sxx/(Syy-Sxy^2/Sxx)}^1/2
=Sxy/Sxx×√Sxx/√Syy×{(n-2)/(1-Sxy^2/Sxx・Syy)}^1/2
=Sxy/√Sxx√Syy×{(n-2)/(1-Sxy^2/Sxx・Syy)}^1/2
=r/SEr

SErというのは相関係数の標準誤差で、SEbのごとく求められますが、相関係数はx軸の変動もy軸の変動も1に基準化していますので、yの全変動1から相関による変動を引いて、それを自由度とxの変動1で基準化したものです。

また、上記の関係から相関係数が0なら回帰係数も0になることが分かります。
よって、

to=r/{(1-r^2)/(n-2)}^1/2
=r√(n-2)/√(1-r^2)

となり、rだけから検定統計量toが求まります。この最後の式は暗記しておかないとQC検定や統計検定は受からないでしょう。これは、相関係数の検定でも使われる式です。

あとは、面倒なのでR(統計ソフト)でやりました。

n <- 526
r2 <- 0.186
r <- sqrt(r2)

(to <- r * sqrt(n -2) / sqrt(1 - r2))
10.94233

たぶん、丸めの誤差と思いますが、上の値とほぼ同じですよね。これをt表で読んだ値と比較します。まあ、ここまでn数が大きいとほぼ正規分布の値ですね。

qt(0.95,(n - 2))
1.647767

toはtを上回っているので、回帰係数は有意です。

(2)信頼区間は、b ± t(0.95,φ)×SEb です。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!