[統計]「●●な人は△△ですか？」　必要な標本数は？

Question

俺は統計は素人です。

よく人間関係カテゴリで見かける気がする

「背の低い人はダメですか？」
とかその他諸々。

自分はあまり回答を読みに行かないのだが、自分の経験から話す人が多く、実験やらソースやらを示している人は少ないんじゃないかと考えた。

もちろん、「人によって異なる」とか「誤差が出る」のだろうけど、「日本国民の90%以上の人についてはYESである」と明言するためにはアンケートで何人ぐらいの標本を採ればいいのだろう？

教えてgooのアンケートで回答する回答者にも偏りがあるだろうが、ここでは無視したいなぁ・・・
========
うまく質問内容が伝わっているだろうか？

stomachman · Accepted Answer

母集団である対象人口Nが小さい場合はイロイロ細かいことが出て来て難しくなりますんで、ここではNがすごく大きいとします。で、ある質問に「YES」と答える人がNp人(0≦p≦1)いるとします。
　すると、このN人の中からランダムにM人を選んで同じ質問をしたとき、「YES」と答える人の数が丁度r人になる確率は二項分布
B(M,p,r) = combin(M,r) (p^r) ((1-p)^(M-r))
になります。平均は m= Mp, 分散は σ^2 = Mp(1-p) です。
　さて、Mが大きいとき、B(M,p,r)は平均m,分散σ^2の正規分布で近似できます。従って、r/Mがm/M-ε～m/M+εの範囲に入る確率を例えば95%以上にしたければ、εM≒2σになるようにσを決めれば良い。一般にεM≒kσ（kは信頼度係数）とすると、
(εM)^2≒(k^2)Mp(1-p)
だから、
M≒((k/ε)^2)p(1-p)
となります。p=1/2のときにMは最大になって、
Mmax ≒ ((k/ε)^2)/4

　ここでさらにk=2（95%の信頼度）に固定してみると、
Mmax(k=2)  ≒ (1/ε)^2
ですから、例えばMmax(k=2)=1500とすると逆に、ε≒1/√1500≒1/40=2.5ポイントと分かります。つまり、「±2.5ポイント程度の誤差を許して、95%の信頼度なら1500人ぐらい」というコトです。（±2.5ポイントっていうのは、例えば、「YESと答える人が40～45%です」という時の幅である5の半分です。）

　ところでご質問ではp=0.9ですから、
M≒0.09((k/ε)^2)
k=2（95%の信頼度）にすると、誤差範囲±2.5ポイントなら600人ぐらい、±0.5ポイントなら14000人ぐらいってこってすね。もちろん、pがあらかじめ予想できていない場合には、最悪のケース、つまりp=0.5で調査対象人数Mを決めるしかありません。

age_momo · Answer

http://www.wound-treatment.jp/next/wound225.htm

このあたりでどうでしょう。

yambejp · Answer

統計学的には1500人くらいだそうです。
もちろん、どこまで正確に無作為抽出ができるかにも
よるでしょう。

googleアタリで「統計学 サンプリング」などで
サーチするとヒットします

[統計]「●●な人は△△ですか？」 必要な標本数は？

母集団である対象人口Nが小さい場合はイロイロ細かいことが出て来て難しくなりますんで、ここではNがすごく大きいとします。

統計学的には1500人くらいだそうです。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

[統計]「●●な人は△△ですか？」　必要な標本数は？

　母集団である対象人口Nが小さい場合はイロイロ細かいことが出て来て難しくなりますんで、ここではNがすごく大きいとします。