プロが教える店舗&オフィスのセキュリティ対策術

数学や統計学に詳しい方、お力を借していただけないでしょうか(>_<)
ある統計学のテキストを読んでいると、「えっ?」と頭を悩ませることになってしまいまして・・・


標本抽出実験のためにA政党支持者とB政党支持者からなる母集団を考え、A政党支持者比率(母比率π)を0.4とします。母集団はA政党、B政党からなる質的データですが、これを2つの値しかとらない変数(ダミー変数と呼びます)を用いて、

X_i=1:A政党支持  X_i=0:B政党支持

のように表しますと、データ数がNの母集団では、
A政党支持者数=Σ_i^N▒X_i 、母比率π =(Σ_i^N▒X_i )/N
となりますので、比率は変数Xの平均値となります。さらに、変数Xの母集団における分散σ^2を考えると、
σ^2=(Σ_i▒〖(X_i-π)〗^2 )/N=π(1-π)^2+(1-π) π^2=π(1-π)(1-π+π)=π(1-π)
となりますので、このケースでは母比率π=0.4ですから、σ^2=0.4(1-0.4)=0.24です。


数式はうまく貼りつけることができず文字化けしてしまってる箇所もあるので、添付の画像ファイルをご覧になっていただきたいのですが、私はどうしても赤字箇所が理解できないのです(ToT)
「なぜこのような数式の展開になるの?」と、昨日からずっと考えてるのですが一向に理解が進みません。
皆様の回答をいただければ幸いです。
よろしくお願いします<m(__)m>

「数学や統計学に詳しい方、お力をお借しくだ」の質問画像

A 回答 (1件)

いまXiは1か0しかとらない変数ですよね。


そしてiは1からNで、i番目の人がA政党支持ならXi=1、i番目の人がB政党支持ならXi=0ですね。
ここまでは確認。

さて、話を簡単にするために、人を並び替えてA政党支持者を前半にB政党支持者を後半に並ばせましょう。
つまり、全員が一列に並んだら
  Xi = {1,1,1,1,1,...,1,0,0,0,...,0}
となるわけです。
ただし全体の中でA政党支持者の割合はπ=0.4ですから、先頭からN*π=N*0.4人まで1が並び、その後、N*(1-π)=N*0.6人は0が並びます。

いよいよ実際に分散を計算しましょう。
まず、
  σ^2 = (Σ[i=1~N]{(Xi-π)^2})/N
これは分散の定義なので納得してもらえますよね。
次にΣの中を具体的に書き並べます。
  (Σ[i=1~N]{(Xi-π)^2})/N =
    (1/N)*( (1-π)^2 + (1-π)^2 + (1-π)^2 + ... + (1-π)^2 + (0-π)^2 + (0-π)^2 + (0-π)^2 + ... + (0-π)^2)

(1-π)^2が並んでいるのはA政党支持者の部分で、(0-π)^2が並んでいるのはB政党支持者の部分ですね。
先ほども書いたように、(1-π)^2は先頭からN*π人並んでいると言うことがわかりますか?
(1-π)^2をN*π人分足すんだから前半部分の合計は、
  N*π*(1-π)^2
となりますね。

同様に、(0-π)^2は後半にN*(1-π)人並んでいますね。
(0-π)^2をN*(1-π)人分足したら後半部分の合計は
  N*(1-π)*(0-π)^2
となりますね。

これをさきほどの式に当てはめれば、
  (Σ[i=1~N]{(Xi-π)^2})/N = (1/N)*( N*π*(1-π)^2 + N*(1-π)*(0-π)^2 )
Nを約分して
    = π*(1-π)^2 + (1-π)*(0-π)^2 = π*(1-π)^2 + (1-π)*π^2
となるのです。
    • good
    • 0
この回答へのお礼

なるほど理解できました、すごくわかりやすいです!
確かにA政党支持者の割合はN*π、B政党支持者の割合はN*(1-π)ですよね。シグマの中のA政党支持者、B政党支持者それぞれの合計を求める際にN*π倍(A政党)、N*(1-π)倍(B政党)するという発想は私には思いつきませんでした。いやはや本当にありがとうございます(>_<)

お礼日時:2009/04/23 21:33

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!