重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

【GOLF me!】初月無料お試し

確率統計において、母集団の標準偏差をσとすると、標本での標準偏差はσ/√nになりますが、母比率の推定においては、標本での標準偏差は√np(1-p)となっています。二項分布であるからnp(1-p)という式になっているのは分かるのですが、私の感覚的には√np(1-p)/√nとなってほしいところです。私のどこに勘違いがあるのか教えていただきたいです。よろしくお願いいたします。

A 回答 (5件)

> どこに勘違いがあるのか



母集団の平均と、標本の平均を区別されていないようです。

【母集団】
母集団の平均は、μで、平均値の分散は0です。
母集団の分散は、Vです。
母集団の標準偏差は、√V=σです。

【標本】
無限大のサイズを持つ母集団から、復元抽出されたn個の標本があるとします。
標本の平均は、m≒μで、標本平均の分散はV/nです。標本平均の標準偏差はσ/√nです。
[注意点] 母集団の平均値は分散が0でしたが、標本の平均値はサンプリングするたびに観測値が変わりますから、分散を持ちます。

また、標本そのものの分散と、標本から母集団の分散を推定したものとでは値が違いますのでご注意下さい(標本分散と不偏分散)。

【二項分布:母集団の概念がありません】
結果がTRUEかFALSEになる試行があり、それらが独立に生起するとき、それをベルヌーイ試行と言います。それをn回繰り返したとき、x回TRUEが生起したとします。
このxは二項分布に従います。
二項分布を正規分布近似したときの、平均はnp、分散はnp(1-p)です。
つまり、n個中x個出現する時のxが分布を持ち、上記はxの平均と分散になります。

比率の場合は、No.2様が書かれているとおりです。
    • good
    • 1
この回答へのお礼

これ以上ないほど丁寧な説明ありがとうございます。完璧に理解しきるにはまだもう少しかかりそうですが、だいぶ整理されてきました。ありがとうございました。

お礼日時:2024/09/19 11:26

「真の母比率pがバラツキのない一定値であっても、xは観測の都度ばらつきます。

」と書きました。

断っておきますが、これは古典論での話です。

ベイズでは、真逆になります。

「xの観測値は紛れもない事実(Fact)であり、母比率pの方がバラツキを持った値として推定される。」

余計な反論が出ないように、書かせて頂きました。
    • good
    • 1

二項分布には母集団の概念がありませんと書きました。



ですが「母比率」はあります。

では、「母比率」とは何か、と言いますと、1試行あたりの真(であろう)の生起確率スモールpです。

つまり、母比率pは「1試行当たり」の確率なのです。(小泉構文)

そして「コインを10回振った時、何回表が出るか」というような、「複数試行からなる観測」を考えたとき、それを事象(event)と言い、その生起確率をラージPで表します。pとPは別物です。

「コインを10回振った時、x回表が出た」のxが観測であり、真の母比率pがバラツキのない一定値であっても、xは観測の都度ばらつきます。
これが二項分布に従い、バラツキ幅を持ちます。

今回、ご質問者様が取り上げられたバラツキは、このxの分散だということです。


さて、観測xの平均や分散から、母比率pの推定を行うことができます。
[注意点]平均はnで割れば良いですが、分散は2乗のオーダーですからn^2で割る必要があります。

すると、母比率pの推定値の分散の分母にはnの項が残ります。
これにより、試行数n→∞で、母比率pの推定値の分散(あるいは標準偏差)は0に収束します。

つまり、大量に観測すれば、真のpの値に漸近するということです。
    • good
    • 2

>標本での標準偏差はσ/√nになりますが



なりません。

母集団から「サイズ n のサンプル」を採ってくれば、その「標準偏差」は「おおよそ σ」になります。
母集団からたくさんの「サイズ n のサンプル」を採ってくれば、その「サンプル平均」の分布の標準偏差は σ/√n になります。これは一般に「標準誤差」と呼ばれます。(母集団の標準偏差 σ が不明のときには、σ の代わりにサンプルから求めた「不偏分散:s^2」の平方根を用いて s/√n を標準誤差とする)

>標本での標準偏差は√np(1-p)となっています

「標本での」ではなく、「母集団の」では?
「二項分布の分散」の「平方根」ですから。

>私の感覚的には√np(1-p)/√nとなってほしいところです

二項分布する母集団では
・期待値 E[X] = np
・分散 V[X] = np(1 - p)
となり、n がある程度大きければ中心極限定理により「正規分布」で近似でき、そのときには
・平均:np
・分散:np(1 - p)
 → 標準偏差:√[np(1 - p)]
になります。

これは「n 回試行したときの、成功回数の分布」ですから、これを「成功比率(確率)の分布」にするには、「試行回数 n」で割ればよいです。
従って、母比率は
・平均:np/n = p
・標準偏差:{√[np(1 - p)]} /n = √[p(1 - p)/n]
になります。
    • good
    • 2

2つ出てくる「標準偏差」って, それぞれ


何の
標準偏差なの?
    • good
    • 2

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!