プロが教える店舗&オフィスのセキュリティ対策術

45のグループの中からA123、B99出現しました。平均は55%です。
各グループをみてみると、A100%のものが8グループ、B100%のものが14グループありました。
グループ毎には違いがあると統計学上言いたいのですが、1グループの出現数が合せても最大17しかありません。どう言う検定方法が良いか?と迷っております。どうみても正規分布しておりません。
ご教示頂ければ幸いです。
ちなみに宿題ではありません。

「検定について」の質問画像

A 回答 (6件)

>それだと、k=2のときφ=0となってしまいます。



以前、k=5の分布の適合度検定で大量の数値シミュレーションをやってみたとき、検定統計量χ^2値の分布は、確かに、pが固定の場合φ=4、実測値からその都度pを計算した場合φ=3の分布に従う結果になったけど、k=2のときは考えてなかったですわ。

pを計算するケースでは、
Σxi=n に加えて、
xiーnip=0 → p=xi/ni
のごとく観測値xiに関して二つの線形制約が入るからという話を読んだことがあるが、項数kがどう絡んで来るかは書いてなかったわ。

n×m分割表の検定の場合、φ=(nー1)×(mー1)だけど、
1×mの分布の適合度検定だと、φ=(1-1)×(mー1)にならないのは何故なのかしらね。

1×mの検定で、(1-1)にならないのは、その向きには考慮すべき線形制約が無いから、1を引く必要がないと考えることはできませんかね。

それから類推すると、
k=2のときは、1項決まれば最初の線形制約から残りの1項も決まり、pは一意に決まるから、1を引くだけで良いとか?
k=3のときは、1項決まっても残りの2項は値が自由に動き得るから(例えば二項分布だとすると、まだpは決まらないから)、pを観測値から推定すると自由度減りますよね?

こう考えるのは、どうかしら。
    • good
    • 2

> もし、観測値からの計算値を使う場合は、φ=k-2となります。



それだと、k=2のときφ=0となってしまいます。
    • good
    • 1

#1です。

老婆心ながら・・・、

#3では、各々の確率pを、観測値から求めた0.554を使うと書きましたが、もし、0.55という値があらかじめ与えられているのであれば、「検定の自由度」が異なってきます。

2×kの独立性検定では、
項数kに対し、自由度φは、一般的には、φ=k-1ですが、これはあらかじめ確率pが与えられている場合に限ります。

もし、観測値からの計算値を使う場合は、φ=k-2となります。

本ケースでは項数kが45と大きいですので、僅差ですけどね。
    • good
    • 1

#1です。

補足です。

#1に書いた11項の分布の適合度とは、添付して頂いたグラフの横軸が11あることから、その各項の度数が分布の期待度数にどれだけ適合しているか、という検定を考えていました。

だけど、重みが全く違う(コイン投げならサンプルサイズが違う)のではないか、ということに気付きました。コインを「10個」投げるという試行を45回繰り返すのならOKですがね。

#2では、45グループの各々の期待度数は、各棟の合計頭数に犬ならば0.554、猫ならば0.446を掛けた値なので、その値からの乖離をχ^2適合度検定を使って検定しようと考えたのです。

であれば、あるマンション全体で犬1匹しかいない場合、期待値0.554と実測値1との乖離で、それは小さいから影響ないよね、と思った次第です。

ただし、そのように度数が小さい場合、ピアソンの適合度検定は使えないので、フィッシャーの正確確率検定でやろうと思った訳です。
    • good
    • 2
この回答へのお礼

お二人ともありがとうございました。お二人ともBAです。54のグループのうち、AとBが出て来る出現割合を調べていて、半世紀前に大学で習った統計の検定が使えないかと思い立ちましたが、なにせ半世紀も前なので、皆様にお聞きしました。
フィッシャーの正確確率検定について勉強し直そうと思います。

お礼日時:2023/09/22 17:12

#1です。



11項の適合度検定はダメかも。

犬ばかり8棟、と言っても、各棟でペットを飼っているのが1世帯しかない、という状況では怪しい結果になりますね。

出現数不揃い(試行数不揃い)での分布の適合度の検定はダメですね。

グループ毎の内訳が必要です。

私だったら、2×45の分割表の検定(独立性の検定)をフィッシャーの正確確率検定で行います。
    • good
    • 2

例を上げると、こういうことですか?



ペットを飼っても良いマンション45棟を調査した。
全体では、犬123匹、猫99匹だった。
棟ごとでは、最大17匹だった。
面白いことに、犬ばかりだったのが8棟、猫ばかりだったのが14棟あった。

犬猫の比率はマンション毎に違いがあると言えるか?

55%という数値はどうやって出てきたのですか?
123/222=0.554 を丸めた値ですかね。


これは、分布の適合度の検定問題です。

問題は、帰無仮説を何分布にするか、です。
もし、マンション間に違いが無い=犬好き猫好きの人のマンション選択にはマンション間の差は影響しない、と考えると二項分布でしょう。
すると、見るからに有意です。

ご質問者様の取り上げているグループによっては一様分布かもしれませんので、よく検討なさって下さい。
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


このQ&Aを見た人がよく見るQ&A