電子書籍の厳選無料作品が豊富!

数日前、ペンネーム蘭デブーさんから、
「得られた度数表が二項分布に従うかどうかをカイ2乗検定で確認せよ」
という問題が提示されました。
その解答として貼り付けられた教科書の内容に疑義があるのですが、早々に閉じられて投稿できないので、こちらで質問します。

「4個」のコイン投げを行い、表の出現個数を観測するというベルヌーイ試行を176回行ったときの出現個数0個~4個の観測回数が与えらえています。

数値は、
実測頻度: 10, 40, 60, 50, 16, 計176
期待頻度: 8.497238, 38.52081, 65.48538, 49.47784, 14.01872

解答は、
カイ2乗値はχ^2=1.068
閾値はχ^2[0.95]=7.8
で帰無仮説は棄却されないと書いてありました。

ここで閾値が7.81というのは、φ=3の上側5%点です。
でも、私は本ケースではφ=4であると思います。

質問は、何か私が勘違いしているのでしょうか、というものです。
気になっていますので、どなたか回答をお願いします。

「テキストの解答が間違っているのか、私が間」の質問画像

A 回答 (5件)

テキストが正しい。



セルは5つ、でも和が1という制限があるので-1、さらにpを推定しているので-1。
よって、自由度は 5 - 1 - 1 = 3。

或いは、
(対立仮説での未知母数の数) - (帰無仮説での未知母数の数) = 4 - 1 = 3
より、自由度は3。
    • good
    • 0
この回答へのお礼

ありがとうございました。

2×2分割表の流れで短絡的に自由度を決めたのかと思ったのですが・・・
pの推定はφT=4×176の情報に基づいており、本表中の線形制約として入ってこないのでは、と思いました。
もしこれが、サイコロの出目の検討なら、期待確率は全て1/6だという推定が必要ですが、これもφ=4になるのでしょうか。

後半はついていけないので、勉強します。

お礼日時:2021/12/15 08:06

> 実度数合計176から期待度数合計176を引けば0だからです。



それについては、それぞれ176で割れば、No.1で記載した「和が1という制限」と同じことです。
(正確には「確率の和が1という制限」と書くべきでした)
    • good
    • 0
この回答へのお礼

はい。

お礼日時:2021/12/18 20:31

期待確率を推定すると、得られたデータに近い値になるから、χ^2 値が小さい値になりやすいということではないでしょうか。



私の勝手なイメージですが、X_1, X_2, …, X_n を平均が μ である分布からの無作為標本としたとき
Σ_k (X_k - μ)^2/n
の期待値より、μを標本平均に置き換えたものの期待値の方が小さいのと同じようなものと思っています。
    • good
    • 0
この回答へのお礼

ありがとうございます。

違います。期待度数も合計が176になるからです。
実度数合計176から期待度数合計176を引けば0だからです。
でも、これだって線形制約には違いない。

もし、サイコロを12回振ったときの出目が、
目 1 2 3 4 5 6
回 3 1 1 3 2 2
だとすると、
回の合計=12
期待度数(2)との差異の合計=0
になるのですが、これも同じメカニズムです。
ただ、後者の制約は、前者の制約の繰り返し(定数を引いただけ)のようなものなので、自由度には影響しないのか。

今度、学会の集まりがあるので、ご回答者以外の方のご意見も伺ってみようと思います。
出題者が言ったか言わなかったかで自由度が変わるって、おかしいでしょって。

たぶん、私(自由度は期待確率(の求め方)に依存しない)が変人扱いされると思いますがね。(求め方=言ったか言わなかったかも含む)

なお、ポアソン適合度は、λ(平均)のせいで、自由度が-2になると理解していました。これも「出題者が求めて確定」だったら-1に変わるのか。聞いてみたいです。

変な質問にお付き合いさせ、すみませんでした。しばらく待って(まだ納得は出来ていませんが)#1にベストアンサーを付けさせて頂きます。

お礼日時:2021/12/17 08:24

> ところで、もし問題文中にp=375/(4×176)の二項分布に従うのか・・・


と指定してあれば、φ=4ですかφ=3ですか。

勿論、指定してあれば自由度は4になります。
    • good
    • 0
この回答へのお礼

ありがとうございました。
私は自由度(自由に動ける)とは線形制約の結果生まれると理解していました。

このケースでは、
10+40+60+50+16=176
(10-8.497)+(40-38.52)+(60-65.49)+(50-48.48)+(16-14.02)=0
の2つの線形制約が入りませんか?
だから自由度が2減ると言われれば理解できるのですが、期待確率が「指定」されていれば減らない。
サイコロでも同じように線形制約が入るのに自由度が減らない。カラム数の制約のみ。
これも期待確率が「確定?」しているから?
それに対して、期待確率を「推定」していると減る。

自由度とは、母パラメータが確定しているか推定されているかで決まる、というルールなら受け入れざるを得ません。

大変勉強になりました。

お礼日時:2021/12/17 01:36

> 期待確率は全て1/6だという推定が必要ですが



いえ、その場合は推定ではなく確定している値です。
したがって、自由度を1少なくする必要はないので、自由度は5となります。

シミュレーションで確かめてみるのも良いかもしれません。

ちなみに、M×N分割表の場合、No.2で書いた計算をすると
MN - 1 - (M - 1) - (N - 1) = (M - 1)(N - 1)
となります。
    • good
    • 0
この回答へのお礼

ありがとうございました。

分割表検定の件は早とちりでした。

確定・・・
本ケースでは問題文中にp=1/2の二項分布に従うのか・・・と指定してあれば、φ=4で良いんですね。

ところで、もし問題文中にp=375/(4×176)の二項分布に従うのか・・・
と指定してあれば、φ=4ですかφ=3ですか。

そういう風に考えてしまって、pの値が5項の度数値の自由度に及ぼす影響についていまいち理解できていません。

お礼日時:2021/12/16 07:58

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!