ある事象には結果として、1から9の9種類の起こりえる結果があって、それを1830回行ったところ、それぞれの結果が理論上発生するはずの回数(期待度数)と、それが実際に発生した回数(観測度数)が以下であった場合、
統計学的に見て以下の結果はどのくらい起こりやすい結果と言えるのでしょうか?
それぞれの事象が実際に発生した回数(観測度数)は
事象(結果)1 636回
事象(結果)2 355回
事象(結果)3 201回
事象(結果)4 161回
事象(結果)5 133回
事象(結果)6 101回
事象(結果)7 91回
事象(結果)8 74回
事象(結果)9 78回
それぞれの事象が理論上発生するはずの回数(期待度数)は
事象(結果)1 550.88回
事象(結果)2 322.25回
事象(結果)3 228.64回
事象(結果)4 177.35回
事象(結果)5 144.90回
事象(結果)6 122.51回
事象(結果)7 106.13回
事象(結果)8 93.61回
事象(結果)9 83.74回
上の結果を、見よう見まねで、カイ2乗値と有意確率を出してみると、カイ2乗値は32.74186252558485。有意確率は6.8544629978853412e-05となる(?)ようなのですが、
統計学的な数字の意味が分かりません。また、この場合の自由度は64になるのですか?
詳しい方がいらっしゃいましたら、計算間違いも含め、ご指摘を宜しくお願いいたします。
No.1ベストアンサー
- 回答日時:
期待値に対して「はらつき」を持って分布しているものに対して、得られた観測値が「統計的によくある範囲」なのか、「統計的にあり得ないほど珍しい値」なのかを判定するのが「カイ二乗検定」です。
↓ 下記の「例1:適合性の検定」を参考にしてください。理論的な説明も、少し見ておいた方がよいでしょう。
http://www.geisya.or.jp/~mwm48961/statistics/kai …
カイ二乗値の計算は合っているようです。おおよそ「32.742」程度になります。(期待値の有効数字が最大5桁なので、カイ二乗値も5桁程度までしか意味がありません)
統計変数は「事象1~9」の9つの項目の数値なので、自由度は 9 - 1 = 8 です。「64」はどこから持ってきたのですか?
95%の信頼度(=有意水準5%)で「統計的にあり得ないほど偏った値」と判定するには、下記の「カイ二乗分布表」から、「自由度=8」で「確率0.05」になる「カイ二乗値」を読み取ります。すると「15.5073」となります。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/ …
上で計算したカイ二乗値は「32.742」で、「15.5073」よりも大きいですから、上のカイ二乗分布表の「上側0.05」の範囲に十分入っているということです。つまり「5%以下の極めて珍しい、通常あり得ないことが起こっている」との判定です。
「どのくらい起こりやすい結果か」というのは、上に挙げた「カイ二乗分布表」から、表の中の数値が「自由度=8」で「32.742」となる上の欄の「確率p」を探してみてください。表には載っていませんが、「0.005(=0.5%)」よりも小さいことが分かります。
数値で「そのカイ二乗値が起こる確率」を計算したいなら、エクセルの関数
=CHIDIST(32.742,8) ←CHIDIST(カイ二乗値,自由度)
で計算してください。答は「6.85 * 10^(-5)」つまり「0.0000685 = 0.00685%」になると思います。
この程度に「起こり得ない」ことが起こっているということです。
質問文に書かれている「有意確率は6.8544629978853412e-05となる(?)」の数値はこれですね。「有意確率」という言葉はありません。単に「統計的に、その観測値が起こり得る確率」ということです。
「有意」とは、「統計的には通常起こりえないので、それが起こっているということは何か特別な「意味」(=理由)がある」ということです。「有意か、有意ではないか」を判定するには「基準値」が必要なので、上の「有意水準5%」とは、その基準値を「5%にしよう」と取り決めたということです。通常の検定では、有意水準は5%にすることが多いです。
詳しい説明、ありがとうございます。
0.00685%の「起こり得ない」事象なのですか。
自由度は「事象1~9」の9つの項目の数値なので、自由度は 9 - 1 = 8 なのですか。事象数−1なのですね。
私はてっきり、「事象1~9」の9つの項目 −1の 8 と、その9通りの期待値 9 - 1 = 8 を掛けて、 8 × 8 で 64 になるのかと思ってました。
ひょんな事からカイ二乗検定を学び始めた初学者なもので、いろいろと統計的な用語の意味合いを勘違いして理解していたようです。
また、「カイ二乗分布表」も教えて頂きましてありがとうございます。
頂きました説明と、教えて頂きましたリンク先も参考にしながら、もう少し勉強してみたいと思います。
この度は、ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- その他(プログラミング・Web制作) pythonのmap、結果の利用は1度だけ? 5 2022/06/11 12:33
- 哲学 私の思想についてご意見ください。 私は自然回帰主義を唱えています。 私が考える自然回帰主義はどんな事 21 2023/06/17 12:00
- 数学 数学の確率で、集合Xを「事象Aが少なくとも2回起こる試行」集合Yを「事象Aが起こるのは2回以下の試行 5 2023/06/19 21:37
- 統計学 統計 3 2022/09/14 12:56
- 統計学 「Newton」7月号特集記事 6 2022/06/07 21:27
- 政治 コンピューターで政党支持のアンケートをするのって、結果にどんな影響が出るでしょう? 5 2023/03/22 17:49
- 数学 コインを投げて特定のパターンが出現する確率 5 2022/07/31 09:06
- 統計学 統計方法 3 2022/10/16 17:40
- Excel(エクセル) マクロで謎の現象が起きていて困ってます。 エクセルで作ったボタンを押すとマクロが動いて処理をしてくれ 3 2023/06/22 17:28
- 統計学 回帰分析検証不一致 5 2022/05/04 20:48
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
写真の式についててですが、上...
-
トランプを横に真っ二つに切り...
-
1個のサイコロを6回投げるとき...
-
諸の使い方について
-
0.5時間などの時間計算の方法
-
logeの計算
-
1000分の3は何%ですか
-
1÷0の答えを教えて下さい
-
10の0.3乗って??
-
分数の計算問題の解き方について
-
土嚢1体で何m3入りますか?
-
ExcelでLog10を自然数に直すには
-
【Excel】 SUMPRODUCT関数の高速化
-
kDaからbpへの変換について
-
閏年の金利
-
ガラス器具の許容範囲誤差と有...
-
20000円の3分の2の計算のしかた...
-
1000分の10の計算の仕方を教え...
-
化学(原子量)の有効数字
-
o-,p-,m-次クロロベンゼンの双...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
数Aです。 52枚のトランプから...
-
常微分方程式 定数変化法 なん...
-
統計学? 排反と余事象の違いは...
-
男子3人,女子4人から3人を選ぶ...
-
場合の数、確率 44 サイコロ 早...
-
最大値・最小値の確率
-
諸の使い方について
-
1個のサイコロを6回投げるとき...
-
確率論と統計学の{補事象(compl...
-
数学Aの確率で、排反事象の見分...
-
数学A a~bまで最短経路で行く...
-
強マルコフ性について
-
白たま4個赤玉6個が入った袋か...
-
条件付き独立について
-
確率での「事象の独立」の解釈...
-
数学の極限の問題です!
-
従属変数が名義尺度かつ複数事...
-
確率の問題の、「見た目が全く...
-
確率を計算してほしいです。景...
-
0.5時間などの時間計算の方法
おすすめ情報
ちなみに上の数字は、2016年12月22日東証1部上場株価の最上位桁毎のベンフォードの法則から予想される期待値と実際の銘柄数になります。
(事象1は株価の最上行桁が「1」になる銘柄の期待数と実際の銘柄数、事象2は株価の最上行桁が「2」になる銘柄の期待数と実際の銘柄数、事象3〜9も同様)