出産前後の痔にはご注意!

度々すいません。

X1,X2,X3を標準化した3つの試験科目の得点として、Y=(X1+X2+X3)/3とする。X1とX2の相関係数、X2とX3の相関係数、X1とX3の相関係数がそれぞれ0.5である場合、X1とYの相関係数はいくらか。という問題です。

標準化された確率変数の平均は0、分散は1なので、XiとXjの相関係数は共分散と等しい。
よってCov[X1,X2]=Cov[X1,X3]=Cov[X2,X3]=1/2である、というところまでは理解しました。
相関係数を求めるに辺り、V[Y]に関して、
V(X+Y)=V(X)+V(Y)+2Cov(X,Y)という公式から、
V[(X1+X2+X3)/3]が{1+1+1+2×(1/2)+2×(1/2)+2×(1/2)}/9になるのかなというのは分かったのですが、
Cov[X1,Y]=Cov[X1,(X1+X2+X3)/3]というところまで来て、この値が=(1+1/2+1/2)/3になるというステップが分かりません。

多分基本的な知識が抜けていると思うのですが、教えて頂けますでしょうか。

A 回答 (1件)

基本通りに計算すればよいだけです。


なお、X1, X2, X3 は各々 N(0, 1) に従うデータ群とします。

共分散の定義は、X1, X2 の平均を μ1, μ2 として
 Cov(X1, X2) = E[(X1 - μ1) * (X2 - μ2) ]

相関係数の定義は、X1, X2 の標準偏差を σ1, σ2 として
 ρ12 = Cov(X1, X2)/(σ1 * σ2)

です。

X1, X2, X3 は各々 N(0, 1) に従うデータ群なので

 E[X1] = 0, V[X1] = 1 → σ1=1
 E[X2] = 0, V[X2] = 1 → σ2=1
 E[X3] = 0, V[X3] = 1 → σ3=1

ということです。

よって

 ρ12 = Cov(X1, X2) = 0.5   ①
 ρ23 = Cov(X2, X3) = 0.5   ②
 ρ31 = Cov(X3, X1) = 0.5   ③

なので

 Cov(X1, X2) = E[X1 * X2 ] = 0.5   ④
 Cov(X2, X3) = E[X2 * X3 ] = 0.5   ⑤
 Cov(X3, X1) = E[X3 * X1 ] = 0.5   ⑥

ということになります。

ここで、
 Y = (X1 + X2 + X3)/3
なので
 E[Y] = (1/3)E[X1] + (1/3)E[X2] + (1/3)E[X3] = 0

共分散の定義から
 Cov(X1, Y) = E[ (X1 - E[X1]) * (Y - E[Y]) ]
= E[ X1 * (X1 + X2 + X3)/3 ]
= (1/3) * E[ X1^2 + X1*X2 + X1*X3 ]
= (1/3) * { E[X1^2] + E[X1*X2] + E[X1*X3] }  ←④⑥を代入
= (1/3) * (1 + 0.5 + 0.5)  ← E[X1^2] = V[X1] = 1
= 2/3
    • good
    • 1
この回答へのお礼

Cov(X1, Y) = E[ (X1 - E[X1]) * (Y - E[Y]) ]
= E[ X1 * (X1 + X2 + X3)/3 ]
= (1/3) * E[ X1^2 + X1*X2 + X1*X3 ]
= (1/3) * { E[X1^2] + E[X1*X2] + E[X1*X3] }
あたりで引っかかっていました。
わかりやすい解説ありがとうございました!

お礼日時:2017/09/19 12:05

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Q統計の問題について

過去の実績から予想される今回のイベント参加者数が平均50人のポアソン分布に従うとき、準備する記念品の数が60個では足りなくなる確率はいくらか。なお平均λが20以上のポアソン分布は正規分布で近似できると考える。
という問題なのですが、回答では標準化を利用して、60人と平均50人の差分を標準偏差で割り、標準正規分布表より記念品の数が60個で不足する確率を算出していました。
一つ気になるのが、標準正規分布表の上側確率というのは、「その値以上の値を取る確率」ですよね?
ということは60人では無く、61人と平均50人の差分を取らなければならない気がする、つまり60-50だと参加者が60人だったときも記念品が不足するということになる気がするのですが、これはどういうことなのでしょうか?

Aベストアンサー

No.1です。ひょっとすると「日本語」の問題ですか?
確かに「60個では足りなくなる確率」なので、「60人」ちょうどまでは「間に合う」ということですね。でも「正規分布」として「連続分布」で考える限りは、確率変数が「60 + ε」になったらアウトなのです。
その辺は、問題文からしっかり読み取らないといけません。

>平均50人のポアソン分布
>正規分布で近似できる

ということは
 N(50, 50)
の正規分布で考えろということですよ。

従って
 σ = √50 ≒ 7.07
で、
60超 → 平均値 + 1.41σ より大きい

これは、標準正規分布表で 1.14≦Z となる確率を求めて(例えば下記の標準正規分布表から)
https://staff.aist.go.jp/t.ihara/normsdist.html

 P=0.07927

ですから、7.9% ということ。「1.41σ を含むか含まないか」は、確率的にはほとんど意味がありません。


人気Q&Aランキング