プロが教える店舗&オフィスのセキュリティ対策術

黒と白の碁石がx:yの割合で合計10000個壺の中に入っている。この中から無造作に10個取り出したら3個が黒石だった。黒石はいくつ入ってたか?
答えが3000プラスマイナス2840になるのですが何故そうなるのかわかりません。わかるかた教えてください

A 回答 (4件)

統計のz検定とかt検定とかを使って、サンプルから母集団を推計する方法を使っている。


多くの場面で使われる手法。

白石を0、黒石を1と置いて、10個中1が3個だったら、10000個中で1が幾つ有るかを推計する。

10個のサンプルでは
平均:0.3
標準偏差:0.458258
サンプル数:10

これを元に母集団を推計すると
0.3±1.96×標準偏差/√10となる。

計算すると
0.3±1.96×標準偏差/√10=0.3±0.2840

母集団は10000個だから,上を掛け算すると
3000±2840

ってな具合で推計出来る。
    • good
    • 0
この回答へのお礼

標準偏差はどのように求めたのですか?

お礼日時:2017/09/14 08:43

黒の割合:x/(x + y) = p


白の割合:y/(x + y) = 1 - p

で、1万個から10個取り出すので、近似的にこの比率が変わらないと考えれば、この試行結果が「二項分布」に従うことはわかりますか?
つまり、n 個取り出して、黒が k 個の確率は
 P(n, k) = nCk * p^k * (1 - p)^(n - k)

今回は、現実にサンプルをとったら
 サンプル 10 個中、黒 3個
つまり「3/10 が黒」だったということです。
このサンプルからすると p = 3/10 ですが、別な「10個サンプル」を取ったら、黒は4個だったり5個だったり2個だったり、いろいろばらつくでしょう。

二項分布では、理論的には
 期待値:E = np
 分散 :V = np(1 - p)
となることが分かっていますから、 p = 3/10 のときの理論上のばらつきは計算できます。

つまり、10個取り出したときの黒の個数:
 期待値:E = 10 * 3/10 = 3 ←これが試行結果。こうなるように p を決めた。
 分散 :V = 10 * 3/10 * 7/10 = 2.1 ←これがばらつきの推定値
従って、標準偏差の推定値は
 σ = √V ≒ 1.449
です。

仮に「10個サンプル」を多数回採取したら、その結果の「黒の個数」は「正規分布する」ことになるので、「10個サンプル」の黒の数の「95%信頼区間」(の推定値)は
  期待値 ± 1.96σ   ①
となります。(質問には書かれていませんが、通常使われる「95%信頼区間」「有意水準5%」だと解釈しました)

(注)①は「正規分布」の特性です。
 ご承知とは思いますが、「正規分布」とは、平均値をピークに、左右対称にダラ下がりの分布です。
 このとき、標準偏差を「σ」として、
  平均値± σ の範囲に、全体の度数の 68.3% が入る
  平均値±2σ の範囲に、全体の度数の 95.4% が入る
  平均値±3σ の範囲に、全体の度数の 99.7% が入る
という特性があります。
http://www.stat.go.jp/koukou/howto/process/p4_3_ …

 これを、σ側ではなく「全体の○○%」の方を基準にした言い方にすると
  平均値± 1.65σ の範囲に、全体の度数の 90.0% が入る
  平均値± 1.96σ の範囲に、全体の度数の 95.0% が入る
  平均値± 2.57σ の範囲に、全体の度数の 99.0% が入る
ということになります。
 上記では、この「95.0%」の範囲を使いました。


 ということで、「10個サンプル」のうちの黒の個数の「95%信頼区間」は
  3 ± 1.449*1.96 = 3 ± 2.840
となります。
 これから「10000個」を推定すれば、黒の数の「95%信頼区間」は
  3000 ± 2840 個
ということになります。
 これは、「95%の的中率で、壺の中には黒が 160~5840個あると言える」ということです。あまり的確な予測になっていなのは、サンプルが 10個、しかも1回だけと少ないからです。
    • good
    • 0

「無造作」って、どういう意味でしょうかね。

    • good
    • 0

>>標準偏差はどのように求めたのですか?


サンプルは、0,0,0,0,0,0,0,1,1,1 の10個だから平均=0.3

分散={(0-0.3)²+(0-0.3)²…(1-0.3)²+(1-0.3)²+(1-0.3)²}/10=0.21
標準偏差=√分散=√0.21=0.458258
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!