プロが教えるわが家の防犯対策術!

 よろしくお願いします。
 昨日,竹内薫さんが書いた「白い仮説,黒い仮説」という本を読みました。その中で,視聴率に関することが書いてありました。正確な数字は忘れましたが,24%と23.6%の視聴率で24%の方が高いとはいえない。なぜなら600世帯ぐらいの調査であれば,誤差の簡便な見積りとしては600の平方根である24世帯分ぐらいの誤差 パーセントに直すと24/600で4%ぐらいの誤差がある。(正確に計算すると3.3%ぐらい)とありました。

 そこで質問です。

1.誤差の簡便な見積りがサンプル数の平方根でできるのはなぜでしょうか。誤差を標準誤差とするのなら,標準偏差/サンプル数の平方根だと思います。このこととどのような関係があるのでしょうか?

2.正確に計算すると3.3%ぐらいとあった気がするのですが,上記の情報から標準偏差をどのように見積もったのでしょうか?

 御回答いただけたら幸いです。

A 回答 (1件)

本当にざっくりとした回答ですが、



本来、2の質問から考えるべきでしょうね。
今、視聴率はその番組を見たか見なかったかの選択ですので
2項分布になります。真の比率をpとすると1標本あたりの
期待値はp、分散はp(1-p)となります。
標本数が複数になるとp*標本数とp(1-p)*標本数ですね。
ある程度の標本数になると2項分布は正規分布に近似できますから
N(p*標本数,p(1-p)*標本数)に近似します。
なので標準偏差は分散の平方根をとり

√{p(1-p)*標本数}

で計算できます。更に調査結果はある程度このpを表していると
仮定するとp=0.24が使えます。(標本数が少ない場合は少し厳密な
式を使うようですが、とりあえずざっくりです)
今の例の場合だとp=0.24,標本数600で標準偏差は約10.6と計算されます。
後は標準偏差に対してどれぐらいの範囲を見込むかですが、
95%有意で2倍、±21世帯ぐらいの振れがあったと考えていいと
思います。

1に戻りますが、上に書いたように標準偏差を

√{p(1-p)*標本数}

とみなすと標本数の平方根はこの1/√{p(1-p)}倍です。
24%あたりなら2.34倍、計算してみると13%から30%ぐらいまでで
2-3倍の範囲に入ります。おかしくない値だと思います。
だから簡便な見積もりとして誤差が√標本数と考えると
書いてあるのでしょう。ただ、本来は真の値pにも依存することは
知っておいてください。
    • good
    • 0
この回答へのお礼

 早速お返事をいただきありがとうございます。お礼が遅くなってしまい申し訳ございませんでした。知りたかったことはすべて解決しました。また,標本数が少ない場合はもう少し厳密な式があることも知ることができ感謝です。大変勉強になりました。

お礼日時:2008/03/07 23:05

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!