

俺は統計は素人です。
よく人間関係カテゴリで見かける気がする
「背の低い人はダメですか?」
とかその他諸々。
自分はあまり回答を読みに行かないのだが、自分の経験から話す人が多く、実験やらソースやらを示している人は少ないんじゃないかと考えた。
もちろん、「人によって異なる」とか「誤差が出る」のだろうけど、「日本国民の90%以上の人についてはYESである」と明言するためにはアンケートで何人ぐらいの標本を採ればいいのだろう?
教えてgooのアンケートで回答する回答者にも偏りがあるだろうが、ここでは無視したいなぁ・・・
========
うまく質問内容が伝わっているだろうか?
No.3ベストアンサー
- 回答日時:
母集団である対象人口Nが小さい場合はイロイロ細かいことが出て来て難しくなりますんで、ここではNがすごく大きいとします。
で、ある質問に「YES」と答える人がNp人(0≦p≦1)いるとします。すると、このN人の中からランダムにM人を選んで同じ質問をしたとき、「YES」と答える人の数が丁度r人になる確率は二項分布
B(M,p,r) = combin(M,r) (p^r) ((1-p)^(M-r))
になります。平均は m= Mp, 分散は σ^2 = Mp(1-p) です。
さて、Mが大きいとき、B(M,p,r)は平均m,分散σ^2の正規分布で近似できます。従って、r/Mがm/M-ε~m/M+εの範囲に入る確率を例えば95%以上にしたければ、εM≒2σになるようにσを決めれば良い。一般にεM≒kσ(kは信頼度係数)とすると、
(εM)^2≒(k^2)Mp(1-p)
だから、
M≒((k/ε)^2)p(1-p)
となります。p=1/2のときにMは最大になって、
Mmax ≒ ((k/ε)^2)/4
ここでさらにk=2(95%の信頼度)に固定してみると、
Mmax(k=2) ≒ (1/ε)^2
ですから、例えばMmax(k=2)=1500とすると逆に、ε≒1/√1500≒1/40=2.5ポイントと分かります。つまり、「±2.5ポイント程度の誤差を許して、95%の信頼度なら1500人ぐらい」というコトです。(±2.5ポイントっていうのは、例えば、「YESと答える人が40~45%です」という時の幅である5の半分です。)
ところでご質問ではp=0.9ですから、
M≒0.09((k/ε)^2)
k=2(95%の信頼度)にすると、誤差範囲±2.5ポイントなら600人ぐらい、±0.5ポイントなら14000人ぐらいってこってすね。もちろん、pがあらかじめ予想できていない場合には、最悪のケース、つまりp=0.5で調査対象人数Mを決めるしかありません。
#締め切ろうかなーと思っていたところでした。
ご回答有り難うございます
なるほど、非常にわかりやすい解説をありがとうございます。14000人の調査を行わないとそれだけの精度が出ないんですね・・・
±2.5%だと600人という少なさになるんですね!
意外です。教えてgooの回答数が確か400台だったから
このくらいあれば参考になるのかもしれませんね。
重ねて、No.1,No.2さん含めありがとうございました。
#ちなみに別に会社の人間じゃないが、goo researchに関することでも述べて「オチ」を付けようかとか考えていた不謹慎な人間です(^^;;
No.1
- 回答日時:
統計学的には1500人くらいだそうです。
もちろん、どこまで正確に無作為抽出ができるかにも
よるでしょう。
googleアタリで「統計学 サンプリング」などで
サーチするとヒットします
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
正規分布の確率密度関数の導出
-
重み付き最小二乗法について
-
データの相対誤差について
-
集積公差について教えて下さい。
-
プラスマイナス1.5の範囲に...
-
実験計画法、L18直交表への割り...
-
アップ率の求め方について
-
パーセントの平均の計算式。 42...
-
小数点以下
-
日経平均 上昇の理由
-
パーセントの合計と平均について
-
1週間当たりの労働時間の計算方法
-
手の大きさの平均を教えて頂き...
-
中3でFカップは大きいですか? ...
-
100m3/minは何m3/hになりま...
-
logeをエクセル関数で
-
目標ppmにたいしての達成率は
-
エクセルで過去5年間のデータ...
-
常勤職員数3,118人、平均年齢が...
-
1から30までの自然数の和
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報