数学確率統計

Question

確率統計において、母集団の標準偏差をσとすると、標本での標準偏差はσ/√nになりますが、母比率の推定においては、標本での標準偏差は√np(1-p)となっています。二項分布であるからnp(1-p)という式になっているのは分かるのですが、私の感覚的には√np(1-p)/√nとなってほしいところです。私のどこに勘違いがあるのか教えていただきたいです。よろしくお願いいたします。

kamiyasiro · Accepted Answer

＞ どこに勘違いがあるのか

母集団の平均と、標本の平均を区別されていないようです。

【母集団】
母集団の平均は、μで、平均値の分散は０です。
母集団の分散は、Vです。
母集団の標準偏差は、√V＝σです。

【標本】
無限大のサイズを持つ母集団から、復元抽出されたｎ個の標本があるとします。
標本の平均は、m≒μで、標本平均の分散はV/nです。標本平均の標準偏差はσ/√nです。
[注意点] 母集団の平均値は分散が０でしたが、標本の平均値はサンプリングするたびに観測値が変わりますから、分散を持ちます。

また、標本そのものの分散と、標本から母集団の分散を推定したものとでは値が違いますのでご注意下さい（標本分散と不偏分散）。

【二項分布：母集団の概念がありません】
結果がTRUEかFALSEになる試行があり、それらが独立に生起するとき、それをベルヌーイ試行と言います。それをｎ回繰り返したとき、ｘ回TRUEが生起したとします。
このｘは二項分布に従います。
二項分布を正規分布近似したときの、平均はnp、分散はnp(1－p)です。
つまり、ｎ個中ｘ個出現する時のｘが分布を持ち、上記はｘの平均と分散になります。

比率の場合は、No.2様が書かれているとおりです。

kamiyasiro · Answer

「真の母比率ｐがバラツキのない一定値であっても、ｘは観測の都度ばらつきます。」と書きました。

断っておきますが、これは古典論での話です。

ベイズでは、真逆になります。

「ｘの観測値は紛れもない事実（Fact）であり、母比率ｐの方がバラツキを持った値として推定される。」

余計な反論が出ないように、書かせて頂きました。

kamiyasiro · Answer

二項分布には母集団の概念がありませんと書きました。

ですが「母比率」はあります。

では、「母比率」とは何か、と言いますと、１試行あたりの真（であろう）の生起確率スモールｐです。

つまり、母比率ｐは「１試行当たり」の確率なのです。（小泉構文）

そして「コインを10回振った時、何回表が出るか」というような、「複数試行からなる観測」を考えたとき、それを事象（event）と言い、その生起確率をラージPで表します。ｐとＰは別物です。

「コインを10回振った時、ｘ回表が出た」のｘが観測であり、真の母比率ｐがバラツキのない一定値であっても、ｘは観測の都度ばらつきます。
これが二項分布に従い、バラツキ幅を持ちます。

今回、ご質問者様が取り上げられたバラツキは、このｘの分散だということです。

さて、観測ｘの平均や分散から、母比率ｐの推定を行うことができます。
［注意点］平均はｎで割れば良いですが、分散は２乗のオーダーですからn^2で割る必要があります。

すると、母比率ｐの推定値の分散の分母にはｎの項が残ります。
これにより、試行数ｎ→∞で、母比率ｐの推定値の分散（あるいは標準偏差）は０に収束します。

つまり、大量に観測すれば、真のｐの値に漸近するということです。

yhr2 · Answer

＞標本での標準偏差はσ/√nになりますが

なりません。

母集団から「サイズ n のサンプル」を採ってくれば、その「標準偏差」は「おおよそ σ」になります。
母集団からたくさんの「サイズ n のサンプル」を採ってくれば、その「サンプル平均」の分布の標準偏差は σ/√n になります。これは一般に「標準誤差」と呼ばれます。（母集団の標準偏差 σ が不明のときには、σ の代わりにサンプルから求めた「不偏分散：s^2」の平方根を用いて s/√n を標準誤差とする）

＞標本での標準偏差は√np(1-p)となっています

「標本での」ではなく、「母集団の」では？
「二項分布の分散」の「平方根」ですから。

＞私の感覚的には√np(1-p)/√nとなってほしいところです

二項分布する母集団では
・期待値 E[X] = np
・分散 V[X] = np(1 - p)
となり、n がある程度大きければ中心極限定理により「正規分布」で近似でき、そのときには
・平均：np
・分散：np(1 - p)
　→　標準偏差：√[np(1 - p)]
になります。

これは「n 回試行したときの、成功回数の分布」ですから、これを「成功比率（確率）の分布」にするには、「試行回数 n」で割ればよいです。
従って、母比率は
・平均：np/n = p
・標準偏差：{√[np(1 - p)]} /n = √[p(1 - p)/n]
になります。

Tacosan · Answer

2つ出てくる「標準偏差」って, それぞれ
何の
標準偏差なの?

数学 確率統計

＞ どこに勘違いがあるのか

「真の母比率ｐがバラツキのない一定値であっても、ｘは観測の都度ばらつきます。

二項分布には母集団の概念がありませんと書きました。

＞標本での標準偏差はσ/√nになりますが

2つ出てくる「標準偏差」って, それぞれ

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

数学確率統計

＞どこに勘違いがあるのか