プロが教えるわが家の防犯対策術!

前回と同じ質問ですが、具体性を欠いていたため、補足して再掲します。
以下、二元配置の分散分析に関しての話です。
一般に母分散の推定は
σハット^2=(データ-○)^2/N-1
※○=分布の平均値
なので、「平均が○で分散がσハット^2の分布だな」とイメージできます。
しかし、交互作用の母分散推定に出てくる式は、
σハット^2=(平均値-○)×(平均値-△)+(平均値-×)×…/自由度
※○△×=各水準の平均値
なので、「平均値がたくさんあって、分散は同一(σハット^2)の分布?」とイメージできません。
質問1:交互作用の母分散推定に出てくる分布は具体的にイメージできる分布ですか?
質問2:なぜ、その式の自由度は(要因1の水準数-1)×(要因2の水準数-1)なのでしょうか?(わたしは、自由度については「全体の数は決まっていて、4つのスペースがある場合、3つが決まると、もう1つは自由に決められない」といった入門書の例で理解しているのですが、さすがに、この場合はこれでは説明がつかないでしょうか?)

以上が前回の質問ですが、具体性に欠いていたため、具体例を追加致します。統計入門書から例を用います。
子どもたちの成績は、1.先生によってちがうのか、2.教えてもらう時間帯によってちがうのか、3.それらの交互作用、の3点について2元配置の分散分析を行う。尚、子どもたちは合計18名、同じような学力で3人ずつ、6つのグループに分けて実験した。授業の後で10点満点のテストを行った。
    A先生         B先生       C先生
午前    3、4、5         6、7、8       3、4、5
午後    2、3、4         3、4、5       1、2、3
ちなみに、平均値に関しては、
    A先生         B先生          C先生
午前      4         7           4          5.0
午後      3          4           2          3.0
     3.5           5.5           3.0
交互作用に関する母分散の推定は、まず、標本平均の分散の推定値を求めます。
標本平均の分散の推定値=(4-3.5)×(4-5.0)+(7-5.5)×(7-5.0)+…+(2-3.0)×(2-3.0)/【(先生の数-1)×(時間帯の数-1)=0.5
わたしが、イメージできないと表現したのは、この「平均がたくさんあり、分散は同一(=0.5)の分布です。
(ちなみに、その後の計算は、標本平均の分散は母分散の1/nですので、3(=n)を掛けた値(=1.5)を推定母分散とします。後は、F値は推定母分散の比ですので、この値を用いて検定します)。

以上、宜しく御願い致します。

A 回答 (2件)

回答1への補足:


 「標本平均の共分散も母分散のときと同じように1/nか」について:

確率変数の組(X1,Y1),(X2,Y2), ... ,(Xn, Yn)は互いに独立に同一の分布に従うとします。つまり,(Xi,Yi)において、XiとYiには相関が0ではないが、(Xi,Yi)と(Xj,Yj)のように組をまたいだ確率変数間では独立です。
さらに、E(Xi) = m, i=1,2,...,n
V(Xi) = s2,i=1,2,...,n
Cov(Xi,Yi) = c, i=1,2,...,n
のように記号を定義しておきます。

X1,...,Xn の標本平均を Xbar とします。
Y1,...,Yn の標本平均を Ybar とします。
XbarとYbarの共分散( Cov(Xbar,Ybar) )を求めます。

Cov(Xbar,Ybar) = E(Xbar*Ybar) - E(Xbar)E(Ybar)
E(Xbar*Ybar) = E[((X1+…+Xn)/n)*((Y1+…+Yn)/n)]
= E[ X1Y1 +…+ X1Yn
+X2Y1 +…+ X2Yn
+ …
+XnY1 +…+ XnYn ] / (n*n)

=(E[X1Y1] + … + E[X1Yn]
+E[X2Y1] + … + E[X2Yn]
+ …
+E[XnY1] + … + E[XnYn]) / (n*n)

確率変数の組は互いに独立であるので,E[X1Y1],...,E[XnYn]以外の期待値は
E[Xi]E[Yj](i≠j)である。よって、

E(Xbar*Ybar) = (E[X1Y1]+…+E[XnYn])/(n*n)
+(∑E[Xi]E[Yj])/(n*n) ← i≠jに該当する項のすべての和

である.

E(Xbar)E(Ybar) = E[X1+…+Xn]E[Y1+…+Yn]/(n*n)
= (E[X1]+…+E[Xn])(E[Y1]+…+E[Yn])/(n*n)
= (E[X1]E[Y1]+…+E[Xn]E[Yn])/(n*n)
+(∑E[Xi]E[Yj])/(n*n) ← i≠jに該当する項のすべての和

ゆえに、
Cov(Xbar,Ybar) = E(Xbar*Ybar) - E(Xbar)E(Ybar)
= {(E[X1Y1]-E[X1]E[Y1]) + … + (E[XnYn]-E[Xn]E[Yn])}/(n*n)
= ( Cov(X1,Y1) + … + Cov(Xn,Yn) )/(n*n)
= c*n/(n*n) ← 確率変数の組は同一の分布に従うと仮定しているから。
= c/n

以上より,Cov(Xbar,Ybar) = c / n ,すなわち,標本平均の共分散は,もとの確率変数の共分散の 1/n 倍 である.
    • good
    • 0
この回答へのお礼

大変丁寧な解説を頂き、感謝の気持ちで一杯です。有難うございました。当方、初心者なもので、これから少し時間をかけて数式を追い、理解に努めたいと思います。その中で、また疑問点が出たら、新たな質問を立てたいと思います。

お礼日時:2010/12/17 16:40

質問1の回答


 交互作用は因子A(先生)とB(時間帯)を組み合わせたときの特別な効果なので、分散の推定値と考えるのではなく、共分散(相関)の推定値と考えてみてはいかがでしょうか。
そうすると、

(1) 各グループ内のデータ(得点)は、先生と時間帯については同じ情報を持っているので平均し、これを交互作用に関してデータ(標本平均)と見なす。
(2) 先生によって平均値が異なるので、標本平均の母平均をそろえるため、先生ごとの平均値を差し引く。
X = (4.0-3.5 , 3.0-3.5 , 7.0-5.5 , 4.0-5.5 , 4.0-3.0 , 2.0-3.0 )
同様に、時間帯についても標本平均の母平均をそろえる。
Y = (4.0-5.0 , 3.0-3.0 , 7.0-5.0 , 4.0-3.0 , 4.0-5.0 , 2.0-3.0 )
(3) XとYについて共分散を求める。ただし、自由度は(a-1)(b-1)なので、
標本平均における交互作用に関する母分散の推定値 = (4.0-3.5)(4.0-5.0)+…+(2.0-3.0)(2.0-3.0) / (a-1)(b-1)。
これをもとのデータのレベルに戻すために、n倍する。

のように考えればすっきりすると思います。
    • good
    • 0
この回答へのお礼

なるほど!「標本平均の分散」を推定したのではなく、「標本平均の共分散」を推定したと考えるのですね。
ただ、1つ難しい点は「標本平均の分散」は母分散の1/Nになっているので、Nを掛ければ母分散になりますが、「標本平均の共分散」も母分散の1/Nになっているのですか?もし、そうならスッキリ理解できるのですが。お手数ですが宜しくお願い致します。

お礼日時:2010/12/16 16:48

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!