統計の本を読んでいたら、χ^2適合度検定の行う際、観測値の組の数が5個以上である場合、各組の理論度数が5を超えていれば、多項分布のχ^2分布による近似は十分制度がよく、したがってχ^2適合度検定が可能である、と書いています。そしてこれは経験則だ、と書いてあります。
理論値が5に満たない場合は、近隣の組と合併して理論値が5以上になるようデータをプールせよ、と書いてあります。そして組の数が5よりも小さい場合には、理論度数が5より若干多くとるように、とあります。しかしどれぐらい大きくとればよいのかは何も言及していません。
したがって心配なのは、組の数が3つの場合と、4つの場合です。この場合、各組の理論度数がいくらあればχ^2適合度検定が行えるのでしょうか。あるいはこの場合は理論値が5あれば、だいたい大丈夫だ、と結論できるのでしょうか。
No.1ベストアンサー
- 回答日時:
こんにちは.同じ内容の質問を繰り返しされているようなので,有益な回答はできませんが,多少アドバイスを書きます.
質問者さんが調べられたように,χ2検定の「期待値5未満」という基準は多項分布の正規近似から派生したものです.質問者さんはどのようなデータであれば,あるいは加工をすれば,近似が上手くいくかどうかを問題にされていますが,正直,今の統計学では,そのような近似にこだわることはもはや得策とはされていません.
正規近似に基づいて統計解析法が開発されてきましたが,現在では,正規近似を仮定しない解析法に統計学者の関心が移っています.つまり所詮,近似は近似にすぎないので,どのような近似になるかにこだわっても意味がないと,統計学者は考えるようになったのだと推測されます.
多少実践的な統計学の教科書であっても「どのようにプールすればよいか」という事細かな指示が書かれているのを,私は知りません.つまり,そのような指示はないと考えた方がよく,また,その指示を発見して,質問者さんがその指示に従って分析をしても,後述する「直接確率法を使えばいいじゃないか」と反論されてしまうでしょう.
現在の統計学では,質問のχ2検定については,近似確率を求めるのではなく,直接確率を求めよ,という指示がされます.無論,直接確率をするのは手計算ではかなり難しい(というか,ほとんど無理)ので,専用の統計ソフトが必要になります.とはいえ,直接確率をしてくれる統計ソフトは,例えばSPSSのアドインソフトにそのようなソフトがありますが,数万円で販売されています.
もともと統計解析法は多数データの分析法です.よって小数データに適応する場合,どうしても無理があることを自覚し,何かをすれば万全だ,というある意味甘い期待は捨てた方がよいでしょう.
そのような自覚をした上で,専門の統計ソフトが使えないのであれば,「仕方なく」期待値5以上になるまでプールするという案を進めていくしかないと思います.
No.2
- 回答日時:
再度登場します.
今読み返してみましたが,質問者さんが,実務的な問題意識からの質問ではなく,純粋な統計学的疑問からの質問であるという可能性をすっかりと失念しておりました.
数学カテゴリへの投稿ですし,後者のタイプの質問であることを考慮すべきでした.見当違いのアドバイスをしてしまった可能性があります.そうであれば,申し訳ありません.ご容赦お願いします.
ありがとうございます。お礼遅くなり申し訳ありませんでした。実はある資格試験で過去に出題された問題だったのですが、ほんとにそれが正しいことなのか疑問に思って質問させてもらいました。大抵の問題にはたとえば小数第4位を四捨五入して、などとかなり正確な確率を計算させたりもしていて、近似計算で本当によいのかとかたびたび不安に感じていました。確かに今は計算機でいくらでも複雑な計算が出来てしまうので、近似する必要性はそれほどないのですね。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 分譲マンション 管理組合の理事の任期について教えてください。 6 2022/07/28 21:27
- 事件・犯罪 刑法についてです 2 2022/06/04 03:11
- 事件・犯罪 刑法についてだれか助けてください。 2 2022/06/05 04:08
- 事件・犯罪 みなさんは死刑制度について、どのような立場を取っていますか?以下の9つの選択肢の中からお選びください 7 2023/05/02 12:52
- 統計学 理論値と実測値の検定方法 3 2022/04/19 09:32
- 統計学 Rを用いた「繰り返しがある直交表実験計画法」の分析方法 8 2023/08/01 17:58
- 統計学 統計学を学んでいるものです。 区間推定や検定において度々 t分布やカイ二乗分布、F分布が現れますが、 6 2023/02/15 14:26
- その他(自然科学) 風車音の測定 3 2023/04/28 07:12
- 統計学 適合性の検定の同等性の検定 15 2022/09/24 00:36
- 数学 参考文献の探し方(数学) 1 2022/07/19 01:09
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
確率の問題 数学と実生活と
-
過去に 「ii) f(z)=1/(z^2-1) r...
-
整数問題 兎に角 難問です 千葉...
-
「an=(n-1)/(n+1)のときlim[n→∞...
-
こちらの式はtan(z)のローラン...
-
これの極限値を求める問題で、 ...
-
指数関数と階乗。グラフで表し...
-
△ABCの辺BCの延長上の点Dを通る...
-
数学Aについて、4でも6でも割り...
-
返信の続きはありますか
-
iphone の自分の声が高すぎるん...
-
30分の動画を2倍速で見たら、3...
-
2024.4.7 03:42の質問に対する2...
-
逆三角関数の方程式の問題です...
-
連続的ポストごめんなさい
-
2022年 東京理科大 難易度判定
-
方程式の計算について
-
背景は何
-
【数学・標準偏差σ】標準偏差の...
-
ベクトル3重積
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
統計検定二級を取っても、大学...
-
学校保険統計の令和3年の17歳男...
-
統計解析での冗長性とは
-
統計で出てくる「binary catego...
-
ワイブル分布をエクセルでグラ...
-
canonical variate analysis
-
統計学の良本、または勉強方法!
-
姉と弟。子どもの満足度が最も...
-
片親や貧乏や底辺高校ほどかわ...
-
傾向スコアの求め方
-
Leave-one-outを用いて重回帰分...
-
SPSSとPythonの違い
-
ナイチンゲールとはなんですか...
-
統計の出し方が全くわかりません。
-
3デルタの計算式
-
社会人が統計学(数学)を勉強出...
-
TukeyHSDとTukey法について。
-
70歳の女性が今後10年以内に...
-
統計解析ソフト
-
統計用語の正しい英語訳を教え...
おすすめ情報