仮説検定とカイ二乗検定の使い分けについて

Question

すみません、統計学を学び始めたばかりで、仮説検定とカイ二乗検定の使い分けについて少々混乱しております。

私の理解では、

仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。

カイ二乗検定では、実際に調べたい事項をHoとし、その結果が棄却されるか否かを検定する

だと思っているのですが、間違っているでしょうか？

なお、これにより、ｐ値から判断する基準が、

仮説検定→ｐ値が小さいほどHoが正しくない可能性が高い
カイ二乗検定→ｐ値が大きいほどHoが正しくない可能性が高い

ということになると思うのですが、合っていますでしょうか。。。？


問題が出たときの仮説の立て方がだんだんとわからなくなってきてしまい、ますます頭がこんがらがっています。

どなたかアドバイスをいただけるとありがたいです。

stomachman · Accepted Answer

> 仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。

　「仮説検定」とは検定のこと、「逆接」とは否定のこと、「Ho」とは帰無仮説のことですね。それなら仰る通りです。
　なお、
(1) 帰無仮説Hoが棄却されなかったときには何も言えない（つまり、話は無に帰す。「帰無仮説Hoを採用する（認める）」なんてのは間違い。）
(2) 帰無仮説Hoが棄却された時には、Hoの否定（￢Ho）が言える。
　だったら「実際に調べたい事項」の否定を帰無仮説にすればいいかというと、いつもそう旨く行くとは限らなくて、
(3) 帰無仮説Hoは統計に関する具体的な予言を導くものでなくては使い物にならない。例えば、「ラーメン屋Aとラーメン屋Bのラーメンは量が同じだ」や「ラーメン屋Aの量はラーメン屋Bの量の1.2倍以上ある」ならば帰無仮説として使えますが、「ラーメン屋Aとラーメン屋Bのラーメンは量が異なる」ではだめ。
ってことには注意すべきです。

> 仮説検定→ｐ値が小さいほどHoが正しくない可能性が高い

　その通りです。p値とは『「Hoが棄却できる（ゆえにHoの否定（￢Ho）が成り立つ）」という判断が間違っている確率』のことです。

> カイ二乗検定では、実際に調べたい事項をHoとし、その結果が棄却されるか否かを検定する

　違います。上記(1)(2)の通り、帰無仮説Hoは否定(棄却)されるか無視される(無に帰す)かのどちらかしかありえませんから、「実際に調べたい事項」（つまり結論として言いたいこと）をHoにしても駄目です。

> 仮説検定とカイ二乗検定の使い分け

　「仮説検定」と「カイ二乗検定」をわざわざ区別する必要はありません。検定において、帰無仮説から「×××は、あるカイ二乗分布に従う」という予言が導けて、それを使って検定する場合を「カイ二乗検定」と呼ぶ。つまり「カイ二乗分布を使った検定」を略して言ってるだけのことです。

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

　例えば、「お昼にカレーを食べると、午後の講義で居眠りするような気がする」という意見について考えます。
　ランダムにサンプリング調査をして
x[1,1] = お昼にカレーを食べ、午後の講義で居眠りした回数
x[1,2] = お昼にカレーを食べ、午後の講義で居眠りしなかった回数
x[2,1] = お昼にカレーを食べず、午後の講義で居眠りした回数
x[2,2] = お昼にカレーを食べず、午後の講義で居眠りしなかった回数
のデータを得たとします。

帰無仮説Ho：「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は独立である（無関係である）。

を立てると、この帰無仮説から
a[i]=x[i,1]+x[i,2]
b[j]=x[1,j]+x[2,j]
N = a[1]+a[2]
χ^2 = Σ((x[i,j]-a[i]b[j]/N)^2)/(a[i]b[j]/N)  　（Σはi=1,2、j=1,2の総和）
とすると、χ^2が自由度1のχ二乗分布に従う、という予言が得られます。

Case 1: 計算してみたらχ^2が3になったとすると、自由度1のχ二乗分布に従うものが偶然3以上になる確率は10%以下である。つまり「Hoが成り立っている場合に、データの偶然のばらつきでたまたまχ^2が3になった」ということが起こる確率(p値)は10%以下である。なので、有意水準10%でHoは棄却でき、Hoの否定：

Ho: 「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は関係がある

が言えます。
　両者の関係が正の相関であっても、負の相関であっても、χ^2は大きな値になる。（χ^2が大きいんだから、データを見ればどっちなのか簡単に区別できる訳ですが。）
　また、「お昼にカレーを食べるのが原因で、その結果、午後の講義で居眠りする」とまでは言えない。というのは、両方に共通の原因（例えば、「寝不足でだるくてさー。お昼に並ぶのがいやだから、一番手っ取り早い激マズカレーにしよっと」）があるのかもしれない。あるいは、因果関係が逆（例えば、「今日の午後の講義は寝てても大丈夫だし少々遅刻してもOK。よおし、超人気激ウマカレーの長蛇の列に並ぼう！」）かもしれない。

Case 2: χ^2が0.45になったとすると、自由度1のχ二乗分布に従うものが偶然0.45以上になる確率(p値)は50%ぐらい。なので有意水準10%ではHoは棄却できず、何も言えない。せいぜい「お昼にカレーを食べることと、午後の講義で居眠りすることの関係は、このデータからは分からん。関係があるとしても、その程度の弱い関係しかない。」としか言えない。

Case 3: χ^2が0.02になったとすると、自由度1のχ二乗分布に従うものが0.02以上になる確率は90%ぐらい。ちっとも珍しいことではない。
　しかし、自由度1のχ二乗分布に従うものが0.02以下になる確率は10%ぐらいしかない訳で、これは珍しい。Hoが正しいと仮定しても説明できないほどχ^2が小さすぎるのです。だから、有意水準10%でHoは棄却でき、その否定

￢Ho: 「お昼にカレーを食べる」という事象と、「午後の講義で居眠りする」という事象は関係がある

が言える。でも、２つの事象の相関が強いほどχ^2は大きくなるのですから、ここで言う「関係がある」というのは相関関係ではありえない。そうじゃなくて、「χ^2が小さくなるように（x[1,1]x[2,2] ≒ x[2,1]x[1,2] となるように）行動している。そうなるような何らかの調節なり規則なりが働いている」という関係なんです。たとえば、「学食のメニューはいつも月火水はカレーだけ、木金はラーメンだけ。月曜と木曜の午後の講義は出席点だけで単位が貰えるのでいつも全員居眠りする」なら、こういうことが起こります。

仮説検定とカイ二乗検定の使い分けについて

> 仮説検定ではHoを立てるときに実際に調べたい事項の逆接をHoとして立て、それが棄却されればH1の実際に調べたかった事項が正しかった証明される。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング