
No.3ベストアンサー
- 回答日時:
> どこに勘違いがあるのか
母集団の平均と、標本の平均を区別されていないようです。
【母集団】
母集団の平均は、μで、平均値の分散は0です。
母集団の分散は、Vです。
母集団の標準偏差は、√V=σです。
【標本】
無限大のサイズを持つ母集団から、復元抽出されたn個の標本があるとします。
標本の平均は、m≒μで、標本平均の分散はV/nです。標本平均の標準偏差はσ/√nです。
[注意点] 母集団の平均値は分散が0でしたが、標本の平均値はサンプリングするたびに観測値が変わりますから、分散を持ちます。
また、標本そのものの分散と、標本から母集団の分散を推定したものとでは値が違いますのでご注意下さい(標本分散と不偏分散)。
【二項分布:母集団の概念がありません】
結果がTRUEかFALSEになる試行があり、それらが独立に生起するとき、それをベルヌーイ試行と言います。それをn回繰り返したとき、x回TRUEが生起したとします。
このxは二項分布に従います。
二項分布を正規分布近似したときの、平均はnp、分散はnp(1-p)です。
つまり、n個中x個出現する時のxが分布を持ち、上記はxの平均と分散になります。
比率の場合は、No.2様が書かれているとおりです。
この回答へのお礼
お礼日時:2024/09/19 11:26
これ以上ないほど丁寧な説明ありがとうございます。完璧に理解しきるにはまだもう少しかかりそうですが、だいぶ整理されてきました。ありがとうございました。
No.5
- 回答日時:
「真の母比率pがバラツキのない一定値であっても、xは観測の都度ばらつきます。
」と書きました。断っておきますが、これは古典論での話です。
ベイズでは、真逆になります。
「xの観測値は紛れもない事実(Fact)であり、母比率pの方がバラツキを持った値として推定される。」
余計な反論が出ないように、書かせて頂きました。
No.4
- 回答日時:
二項分布には母集団の概念がありませんと書きました。
ですが「母比率」はあります。
では、「母比率」とは何か、と言いますと、1試行あたりの真(であろう)の生起確率スモールpです。
つまり、母比率pは「1試行当たり」の確率なのです。(小泉構文)
そして「コインを10回振った時、何回表が出るか」というような、「複数試行からなる観測」を考えたとき、それを事象(event)と言い、その生起確率をラージPで表します。pとPは別物です。
「コインを10回振った時、x回表が出た」のxが観測であり、真の母比率pがバラツキのない一定値であっても、xは観測の都度ばらつきます。
これが二項分布に従い、バラツキ幅を持ちます。
今回、ご質問者様が取り上げられたバラツキは、このxの分散だということです。
さて、観測xの平均や分散から、母比率pの推定を行うことができます。
[注意点]平均はnで割れば良いですが、分散は2乗のオーダーですからn^2で割る必要があります。
すると、母比率pの推定値の分散の分母にはnの項が残ります。
これにより、試行数n→∞で、母比率pの推定値の分散(あるいは標準偏差)は0に収束します。
つまり、大量に観測すれば、真のpの値に漸近するということです。
No.2
- 回答日時:
>標本での標準偏差はσ/√nになりますが
なりません。
母集団から「サイズ n のサンプル」を採ってくれば、その「標準偏差」は「おおよそ σ」になります。
母集団からたくさんの「サイズ n のサンプル」を採ってくれば、その「サンプル平均」の分布の標準偏差は σ/√n になります。これは一般に「標準誤差」と呼ばれます。(母集団の標準偏差 σ が不明のときには、σ の代わりにサンプルから求めた「不偏分散:s^2」の平方根を用いて s/√n を標準誤差とする)
>標本での標準偏差は√np(1-p)となっています
「標本での」ではなく、「母集団の」では?
「二項分布の分散」の「平方根」ですから。
>私の感覚的には√np(1-p)/√nとなってほしいところです
二項分布する母集団では
・期待値 E[X] = np
・分散 V[X] = np(1 - p)
となり、n がある程度大きければ中心極限定理により「正規分布」で近似でき、そのときには
・平均:np
・分散:np(1 - p)
→ 標準偏差:√[np(1 - p)]
になります。
これは「n 回試行したときの、成功回数の分布」ですから、これを「成功比率(確率)の分布」にするには、「試行回数 n」で割ればよいです。
従って、母比率は
・平均:np/n = p
・標準偏差:{√[np(1 - p)]} /n = √[p(1 - p)/n]
になります。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
【数数学理論・統計学・サイコ...
-
数学 確率統計
-
正規分布と対数正規分布の違い...
-
中学2年 数学のカレンダーの問...
-
有効数字の扱い方について
-
上澄み人材(IQ130以上)の数から...
-
消費税10%の税抜き計算と10%OFF...
-
統計学の問題を教えてほしいです。
-
偏差値65の高校が全統模試受け...
-
対数変換のついて
-
平均値と、中央値の違いを教え...
-
偏差値50~55の差と偏差値70~7...
-
統計学
-
ノンパラメトリック検定の多重...
-
国や自治体(あるいは研究機関...
-
確率を教えてください。 基本、...
-
じゃんけんを8回中3勝以上する...
-
HADという統計分析ソフトを使っ...
-
適用範囲
-
以下の場合に全部で何種類の数...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
有効数字の扱い方について
-
偏差値50~55の差と偏差値70~7...
-
中学2年 数学のカレンダーの問...
-
国や自治体(あるいは研究機関...
-
上澄み人材(IQ130以上)の数から...
-
人類が誕生してから現在までに...
-
ヒストグラムを作るんですけど ...
-
消費税10%の税抜き計算と10%OFF...
-
正規分布と対数正規分布の違い...
-
HADという統計分析ソフトを使っ...
-
番号の組み合わせパターン
-
3枚の異なる種類の硬貨を同時に...
-
身長が高くなると出生率が下が...
-
大手金融機関が預入金額5百万円...
-
エクセルでランダム関数で乱数...
-
【数学】確率変数の畳み込みに...
-
ノンパラメトリック検定の多重...
-
ポアソン回帰でのカウントデー...
-
以下の場合に全部で何種類の数...
-
t検定について質問です。 あま...
おすすめ情報