T検定とMann-WhitneyのU検定の使い分け

Question

ある２郡間の平均値において、統計的に有意な差があるかどうか検定したいです。ちなみに、対応のない２郡間での検定です。

Ｔ検定を行うには、ある程度のサンプル数（20以上程度？）があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか？
また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか？
例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか？

また、Ｔ検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか？その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか？

それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。

統計についてかなり無知です、よろしくお願いします。

backs · Accepted Answer

結局ですね、適切な検定というのは適切なp値が得られるということなんですよ。適切なp値というのは第1種の過誤と第2種の過誤をなるべく低くするようにする方法を選ぶということなのですね。

従来どおりの教科書には「事前検定をし、正規性と等分散性を仮定できたら、、、」と書いていありますが、そもそも事前検定をする必要はないというのが例のページの話なのです。どちらが正しいかというと、どちらも正しいのです。だから、ある研究者はマンホイットニーのU検定を行うべきだというかもしれませんし、私のようにいかなる場合においてもウェルチの検定を行う方がよいという者もいるということです。

ややこしく感じるかもしれませんが、もっと参考書を色々と読んで分析をしていくうちにこういった内容もしっくり来るようになると思います。

backs · Answer

>　「等分散性を仮定しないt検定」＝ウェルチの検定、・・・

その通りです。

>　ウェルチの検定も不適当なのではないかと感じているのですが。

例のページには元の分布が正規分布でない場合についても言及されていますでしょ？そういう場合でもウェルチの検定の方が良いということが書かれているはずです。

backs · Answer

> 「正規分布に従っていない」という検定結果にならない限り、ｔ検定を採用してもよろしいことになるのでしょうか？

実際に母集団が正規分布に従っているかどうかは誰にも分かりません。あくまでも「仮定」できればよいのであって、その仮定が妥当なものであれば問題ないのです。

要するにいかなる場合においても「等分散性を仮定しないt検定」を行うと良いということです。事前検定を行うことが、すでに検定の多重性にひっかかると考える人もいます（私もその立場にいます）。

>　正規分布に従わず、等分散でもない場合には、どのような検定方法を採用することになるのでしょうか？

明らかに正規分布に従っているとはいえないようば場合はウェルチの検定を行えば良いです。それは「歪みのある分布」と「一様な分布」のシミュレーショングラフを見れば分かりますね。

backs · Answer

まずサンプル数ではなくてサンプルサイズ、もしくは標本の大きさというのが正しいですね。それから、サンプルサイズが大きければ良いということでもなくて、サンプルサイズが大きければ大した差がないのに有意差が認められるという結果が得られることがあります。これに関しては検出力（検定力）、パワーアナリシスを調べれば明らかになるでしょう。

それから、http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.htmlの記事を読むと、質問者さんの疑問は晴れるでしょう。

kgu-2 · Answer

>サンプル数が少ないと信頼性に欠けるという話
 推測統計学の性質上、サンプル数が多いほど良いのは事実です。理想は、全てのサンプルのデータを得ること。これは、必ず差がでます。1mmでも、1mgで大きいほうが、誰がやっても大きいのです。
　t検定は、「例数が少なくても」というのが特長です。有意差は、有れば「有意差が有る」と書け、説得力が少しは増すだけです。

　信頼性については、「いつくのサンプルなら絶対」というのは、ありません。経験的なもので、特にヒトの場合はいろいろな人がいるので、サンプル数が十分に大きくないと、なんぞが書かれていますが、どれだけなら十分かは客観的に、というのはありません。あくまでも確率です。
　実際、食品とガンとの関係で、味噌汁は、ガンになりにくい、なりやすい、なりにくい、と二転三転しています。

>無作為抽出＝正規分布ということにはならない
　正確に言えば、無作為抽出をしないと、正規分布はしない、ということです。実際には、無作為抽出を無限解すれば、正規分布をする、というのが統計学の基礎です(教科書だと、はじめの部分に記述してある)。そうでないと、t検定根拠を失います。
　例外的に、無作為抽出をしても、「人の平均貯蓄額は、正規分布をしない」というのは有名です。

usokoku · Answer

＞正規確率紙の方法
正規分布の場合だけならば
JIS Z 9041 -(1968)
3.3.4 正規確率紙による平均値および標準偏差の求め方
参照。注意点としては、右上がりの場合のみ正規分布であること。

傾きから他の分布であることも判断できますけど、ある程度のなれが必要です。既知の度数分布を引いてみれば見当つくでしょう。

kgu-2 · Answer

>Ｔ検定を行うには、ある程度のサンプル数（20以上程度？）があった方が良く
 t検定は、サンプル数が少なくてもokというのが特長です。私は動物実験をして、各群3匹、計6匹で有意差有との論文にクレームがついたことはありません。

>Ｔ検定を使用するためには、正規分布に従っている必要がある
　正規分布は、無作為抽出すればOKです。動物の場合は、無作為抽出と想定されますが、ヒトの場合は困難です。正規分布の判定は、正規確率紙の方法は見たことがありますが、知りません。

>U検定
 U検定では、順番の情報しか使いません。10と1でも、2.3と1でも、順位はいずれも1番と2番です。10と1の方が差が大きいという情報は利用されていません。ですから、t検定よりも有意差はでにくいでしょう。しかしサンプル数が大きければt検定と同程度の検出力がある、と読んだことがあります。正規分布していることが主張できないのなら、U検定は有力な方法です。

>これも使う候補に入るのでしょうか
　検定は、どんな方法でも、有意差が有、と判定できれば良いのです。有意差が出やすい方法を選ぶのは、研究者の能力です。ただ、正規分布していないのにt検定は、ルール違反です。

T検定とMann-WhitneyのU検定の使い分け

結局ですね、適切な検定というのは適切なp値が得られるということなんですよ。

> 「等分散性を仮定しないt検定」＝ウェルチの検定、・・・

> 「正規分布に従っていない」という検定結果にならない限り、ｔ検定を採用してもよろしいことになるのでしょうか？

まずサンプル数ではなくてサンプルサイズ、もしくは標本の大きさというのが正しいですね。

この回答への補足

>サンプル数が少ないと信頼性に欠けるという話

＞正規確率紙の方法

>Ｔ検定を行うには、ある程度のサンプル数（20以上程度？）があった方が良く

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

>　「等分散性を仮定しないt検定」＝ウェルチの検定、・・・