電子書籍の厳選無料作品が豊富!

友達フアンクラブ会員が10000人います。このうち450人をランダムにサンプリングし集まりに来るか尋ねたら40%が来ると返事がきました。何人イスを用意すればいいでしょうか?信頼度95%でN-n≒N-1とした時です。

質問者からの補足コメント

  • 早速のご回答ありがとうございました。解決いたしました。お礼申し上げます。

    No.1の回答に寄せられた補足コメントです。 補足日時:2018/07/05 12:02

A 回答 (2件)

母集団の特性を、サンプルから推定するという問題ですね。


質問文だけでは詳しいところが分からないので、適当に「忖度」して書きます。
違うところはご自分で修正してください。

(1) まず、この事象は「来る確率:p」「来ない確率:1 - p」の「二項分布」ですね。

(2) 二項分布では、
 期待値:np
 分散:np(1 - p)
 標準偏差:√[np(1 - p)]
です。
なので、「来る確率:p」が決まっていれば、ランダムに選んだ n人の集団では、来る人の期待値は np 人で、標準偏差 √[np(1 - p)] 人のばらつきを含む、ということです。

(3) 1人の人間にとっての「来る確率」とは何かとか、「来るか来ないかを1人1人がどう決めるるか(当日の体調や気分、天候なども影響する)」といった議論はあるかと思いますが、ここは「統計の練習問題」と割り切って、「来る確率」を「サイコロで1の目の出る確率」と同じようなものと考えましょう。

 そうすれば、「サイコロを450回振って、1の目の出た回数を数えれば、それを『1の目の出る確率』とみなしてよいのではないか」ということになるでしょう。暗に「理論的には1/6だ」と分かっていて、450回の試行からの結果がそれと多少違っていたとしても。

 ということで、「来る確率」は、450人のサンプルの結果からは p=0.4 となります。

 なお、

>N-n≒N-1とした時です。

と書かれているのは、「母集団の個数:N」と「サンプルの個数:n」による「有限修正」は考えなくてもよい、ということですね。実際に
 (10,000 - 450)/(10,000 - 1) ≒ 0.955
ですから、これを考慮しても結果にそれほど影響はしないでしょう。

(4) サンプルの結果から、1万人の集団での参加者人数は
 期待値:10,000 * p = 4,000 (人)
 標準偏差:σ = √[np(1 - p)] = √(10,000 * 0.4 * 0.6) = 48.989・・・ ≒ 49 (人)
と推定できます。

(5) ここで、正規分布の「標準偏差:σ」とは、
  平均値±σ の範囲に、全体の度数の 68.3% が入る
  平均値±2σ の範囲に、全体の度数の 95.4% が入る
  平均値±3σ の範囲に、全体の度数の 99.7% が入る
というものです。
http://www.stat.go.jp/koukou/howto/process/p4_3_ …

 これを、σ側ではなく「全体の○○%」の方を基準にした言い方にすると
  平均値± 1.65σ の範囲に、全体の度数の 90.0% が入る
  平均値± 1.96σ の範囲に、全体の度数の 95.0% が入る
  平均値± 2.57σ の範囲に、全体の度数の 99.0% が入る
ということになります。(この「全体の○○%」が「信頼区間」「信頼度」です)

 質問文で

>信頼度95%で

と書かれているのは、「信頼度 95% で、その範囲に入る参加者人数」ということかと思います。
これは、上の正規分布の特性からすると
  平均値± 1.96σ
ということです。

これに (4) の結果を用いれば、「信頼度 95% で、その範囲に入る参加者人数」は
  4,000 ± 49 * 1.96 = 4,000 ± 96.04 ≒ 4,000 ± 97
ということになります。(確実に 95% を満たすために切り上げました)

つまり、的中率95%(「信頼度 95%」とはそういうこと)で、「最低でも 3,993人は来るし、最大でも 4,097人まで」と推定されるということです。
逆に言えば、「4,098人以上来る確率は 5%未満」ということです。

(注)ただし、これは上に書いたように「来る確率は40%で決まっていて、個人的な都合や気まぐれや、天気によって変わることはない」という「統計の練習問題」だから言える結果です。「サイコロ」などと違って、人間を対象にこんな「確実な予測」などはできません。
(でも、「内閣支持率」とか「支持政党」といった数値は、気まぐれや天候でころころ変わるものではないという前提で、2000人程度を対象にした「世論調査」で、国民・有権者全体を推定することはよく行われています)


以上より、信頼度95%で、参加人数は
  4,000 ± 97 人
と推定されるので、椅子は 4,100 個も用意しておけば「椅子が足らない!」という事態は避けられるでしょう。

 ただし、残りの 5% の確率も起こり得るので、それに対しても何らかの「対策」を考えておくのが、主催者の「リスク・マネージメント」でしょう。それは、この「統計の練習問題」の範囲外です。
    • good
    • 0
この回答へのお礼

本当にご親切にご回答くださいましてありがとうございました。教室で教わりました時には一部私が理解しているとの前提で進みましたので、途中で理解不能になりました。今日初めてご質問させて頂きましたが、この回答を頂き理解できました。重ねてお礼申し上げます。

お礼日時:2018/07/05 12:12

10000人×40%×信頼度95%=3800人


これが最低数、になります。

質問者数に対する回答者数が無い、
40%とは、母数は質問数なのか回答数なのかの記載がない。
N、nなどの意味のせつめいが無い、
等のため、直感で計算しています。あしからず。
この回答への補足あり
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!