プロが教えるわが家の防犯対策術!

ある事象には結果として、1から9の9種類の起こりえる結果があって、それを1830回行ったところ、それぞれの結果が理論上発生するはずの回数(期待度数)と、それが実際に発生した回数(観測度数)が以下であった場合、

統計学的に見て以下の結果はどのくらい起こりやすい結果と言えるのでしょうか?


それぞれの事象が実際に発生した回数(観測度数)は

事象(結果)1 636回
事象(結果)2 355回
事象(結果)3 201回
事象(結果)4 161回
事象(結果)5 133回
事象(結果)6 101回
事象(結果)7 91回
事象(結果)8 74回
事象(結果)9 78回

それぞれの事象が理論上発生するはずの回数(期待度数)は

事象(結果)1 550.88回
事象(結果)2 322.25回
事象(結果)3 228.64回
事象(結果)4 177.35回
事象(結果)5 144.90回
事象(結果)6 122.51回
事象(結果)7 106.13回
事象(結果)8 93.61回
事象(結果)9 83.74回


上の結果を、見よう見まねで、カイ2乗値と有意確率を出してみると、カイ2乗値は32.74186252558485。有意確率は6.8544629978853412e-05となる(?)ようなのですが、

統計学的な数字の意味が分かりません。また、この場合の自由度は64になるのですか?

詳しい方がいらっしゃいましたら、計算間違いも含め、ご指摘を宜しくお願いいたします。

質問者からの補足コメント

  • うーん・・・

    ちなみに上の数字は、2016年12月22日東証1部上場株価の最上位桁毎のベンフォードの法則から予想される期待値と実際の銘柄数になります。

    (事象1は株価の最上行桁が「1」になる銘柄の期待数と実際の銘柄数、事象2は株価の最上行桁が「2」になる銘柄の期待数と実際の銘柄数、事象3〜9も同様)

      補足日時:2016/12/25 01:17

A 回答 (1件)

期待値に対して「はらつき」を持って分布しているものに対して、得られた観測値が「統計的によくある範囲」なのか、「統計的にあり得ないほど珍しい値」なのかを判定するのが「カイ二乗検定」です。


↓ 下記の「例1:適合性の検定」を参考にしてください。理論的な説明も、少し見ておいた方がよいでしょう。
http://www.geisya.or.jp/~mwm48961/statistics/kai …

 カイ二乗値の計算は合っているようです。おおよそ「32.742」程度になります。(期待値の有効数字が最大5桁なので、カイ二乗値も5桁程度までしか意味がありません)

 統計変数は「事象1~9」の9つの項目の数値なので、自由度は 9 - 1 = 8 です。「64」はどこから持ってきたのですか?

 95%の信頼度(=有意水準5%)で「統計的にあり得ないほど偏った値」と判定するには、下記の「カイ二乗分布表」から、「自由度=8」で「確率0.05」になる「カイ二乗値」を読み取ります。すると「15.5073」となります。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/ …

 上で計算したカイ二乗値は「32.742」で、「15.5073」よりも大きいですから、上のカイ二乗分布表の「上側0.05」の範囲に十分入っているということです。つまり「5%以下の極めて珍しい、通常あり得ないことが起こっている」との判定です。

 「どのくらい起こりやすい結果か」というのは、上に挙げた「カイ二乗分布表」から、表の中の数値が「自由度=8」で「32.742」となる上の欄の「確率p」を探してみてください。表には載っていませんが、「0.005(=0.5%)」よりも小さいことが分かります。
 数値で「そのカイ二乗値が起こる確率」を計算したいなら、エクセルの関数
  =CHIDIST(32.742,8)  ←CHIDIST(カイ二乗値,自由度)
で計算してください。答は「6.85 * 10^(-5)」つまり「0.0000685 = 0.00685%」になると思います。
 この程度に「起こり得ない」ことが起こっているということです。

 質問文に書かれている「有意確率は6.8544629978853412e-05となる(?)」の数値はこれですね。「有意確率」という言葉はありません。単に「統計的に、その観測値が起こり得る確率」ということです。
 「有意」とは、「統計的には通常起こりえないので、それが起こっているということは何か特別な「意味」(=理由)がある」ということです。「有意か、有意ではないか」を判定するには「基準値」が必要なので、上の「有意水準5%」とは、その基準値を「5%にしよう」と取り決めたということです。通常の検定では、有意水準は5%にすることが多いです。
    • good
    • 0
この回答へのお礼

詳しい説明、ありがとうございます。

0.00685%の「起こり得ない」事象なのですか。

自由度は「事象1~9」の9つの項目の数値なので、自由度は 9 - 1 = 8 なのですか。事象数−1なのですね。
私はてっきり、「事象1~9」の9つの項目 −1の 8 と、その9通りの期待値 9 - 1 = 8 を掛けて、 8 × 8 で 64 になるのかと思ってました。
ひょんな事からカイ二乗検定を学び始めた初学者なもので、いろいろと統計的な用語の意味合いを勘違いして理解していたようです。

また、「カイ二乗分布表」も教えて頂きましてありがとうございます。
頂きました説明と、教えて頂きましたリンク先も参考にしながら、もう少し勉強してみたいと思います。

この度は、ありがとうございました。

お礼日時:2016/12/25 07:23

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!