プロが教える店舗&オフィスのセキュリティ対策術

t検定を正規分布でない対象に用いるとp値が上がってしまうというネットの記事を見ましたが,中心極限定理によりサンプルサイズの大きい場合母集団の平均の確率分布は正規分布になるので正規分布でなくても2群のへいきんちを比較するt検定は使えるのでは?と感じました.
意見をお聞かせください
僕個人の意見としては外れ値が存在する場合に分散が大きくなってしまいそれでp値が上昇するのかな?とも感じています

A 回答 (4件)

企業で統計を推進する立場の者です。



使えません。

正規分布で無い場合は、ノンパラメトリックな検定を使用することをお勧めします。

参考書
内田治(2019)『Rによるノンパラメトリック検定』,オーム社
    • good
    • 0

#1です。



重要な点を見落としていました。「サンプルサイズが大きい」とのことですが、この場合、どんな些細な差でも有意になってしまいます。
大標本のもとでは、大半の検定は破綻します。検定を使用すべきではありません。
あと、母集団のサンプルサイズは無限大です。ご注意を。

参考書
佐伯・松原(2000)『実践としての統計学』,東大出版会

何ページだっか忘れましたが、本当に書いてあります。
かつてこのサイトで、この本には大標本になると常に有意になると書いてあるがそれは間違いではないか、と質問があり結構盛り上がりました。ずぶの素人が高名な先生の記述を間違いだと書いているのは滑稽でした。
    • good
    • 0
この回答へのお礼

ありがとう

親切な回答をありがとうございます。
紹介していただいた本を見たところ、例として1万だと検定は使えないと書いてありました。
今回の標本データ数は100ほどなので
おそらくその心配はなく実際に有意差が出ていない物もたくさんありました。
しかし知見を広められたことに
改めて感謝いたします。

お礼日時:2020/12/07 21:27

> 中心極限定理によりサンプルサイズの大きい場合母集団の平均の確率分布は正規分布になる



[1] (「母集団」とお書きのところを「サンプルの集団」と読み替えれば)おっしゃる通りです。すなわちkが大きいとき「ランダムに選んだk個のサンプルの平均値」が正規分布に(ほぼ)従う。だから、「ランダムに選んだk個のサンプルの平均値」をランダムに選んだものをn個作って、それを対象にする場合、すなわち:

帰無仮説:「両群の「ランダムに選んだk個のサンプルの平均値」の期待値は等しい」

を検定するのにならt検定が使える、ということです。

[2]「2群の平均値が等しい」という帰無仮説だと、Nがうんと大きければ大抵、有意差が出る。しかし「有意差あり」というだけじゃしょうがないですね。むしろ、「「(A群の平均値 - (B群+m))の平均値が等しい」という帰無仮説が棄却できないmの範囲」を検討するのがよろしいでしょう。
    • good
    • 0
この回答へのお礼

ありがとう

お礼が遅くなりました。
すみません。自分の理解力不足のためにわからないところがありました。
[2]について
「有意差あり」というだけじゃしょうがないですね。むしろ、「「(A群の平均値 - (B群+m))の平均値が等しい」という帰無仮説が棄却できないmの範囲」を検討するのがよろしいでしょう。
まず有意差ありで有意差がある理由を考察するだけで十分だと思っていました。
そして棄却できないmの範囲がわかったら
なにが言えるのかわからなかったです。

お礼日時:2020/12/10 11:09

No.3へのコメントについてです。



> 棄却できないmの範囲がわかったらなにが言えるのか

(A群の平均) - (B群の平均+m)の棄却できない範囲がm0〜m1だとわかれば、「 (A群の平均) -(B群の平均)が m0以下あるいはm1以上」であるということは有意水準以下だ、と言える。つまり、「両群の平均の差」の範囲が絞れます。
    • good
    • 0
この回答へのお礼

助かりました

ようやく理解することができました。
噛み砕いて説明をしていただいてありがとうございました!
この方法はすごいですね
T検定を行なっている本やサイトや論文をいくつか見たことがありましたがこんな使い方があるとは驚きです。しかもこれはマン、ホイットニーのu検定にも応用可能ですね。
かなり知見が深まりました。
ありがとうございます。

お礼日時:2020/12/10 16:26

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!