家・車以外で、人生で一番奮発した買い物

ある2郡間の平均値において、統計的に有意な差があるかどうか検定したいです。ちなみに、対応のない2郡間での検定です。

T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか?
また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか?
例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか?

また、T検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか?その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか?

それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。

統計についてかなり無知です、よろしくお願いします。

A 回答 (7件)

結局ですね、適切な検定というのは適切なp値が得られるということなんですよ。

適切なp値というのは第1種の過誤と第2種の過誤をなるべく低くするようにする方法を選ぶということなのですね。

従来どおりの教科書には「事前検定をし、正規性と等分散性を仮定できたら、、、」と書いていありますが、そもそも事前検定をする必要はないというのが例のページの話なのです。どちらが正しいかというと、どちらも正しいのです。だから、ある研究者はマンホイットニーのU検定を行うべきだというかもしれませんし、私のようにいかなる場合においてもウェルチの検定を行う方がよいという者もいるということです。

ややこしく感じるかもしれませんが、もっと参考書を色々と読んで分析をしていくうちにこういった内容もしっくり来るようになると思います。
    • good
    • 5
この回答へのお礼

何度もお付き合い下さり、ありがとうございます。

なるほど、そういうことなのですね。納得しました。
いろいろ本当に勉強になりました。
もっといろいろな参考書を読んで勉強に励みたいと思います。

本当にありがとうございました。

お礼日時:2008/01/25 17:07

> 「等分散性を仮定しないt検定」=ウェルチの検定、・・・



その通りです。

> ウェルチの検定も不適当なのではないかと感じているのですが。

例のページには元の分布が正規分布でない場合についても言及されていますでしょ?そういう場合でもウェルチの検定の方が良いということが書かれているはずです。
    • good
    • 4
この回答へのお礼

何度もご回答下さり、本当にありがとうございます。

>例のページには元の分布が正規分布でない場合についても言及されていますでしょ?そういう場合でもウェルチの検定の方が良いということが書かれているはずです。

確かにそのような感じに書かれていますね!しかし、かなり混乱しているのですが、t検定の前提は正規分布に従っているということなのですよね?ウェルチの検定を使えば、正規分布でなかろうが、関係ないということなのでしょうか?

申し訳ございませんが、よろしくお願いします。

お礼日時:2008/01/24 23:34

> 「正規分布に従っていない」という検定結果にならない限り、t検定を採用してもよろしいことになるのでしょうか?



実際に母集団が正規分布に従っているかどうかは誰にも分かりません。あくまでも「仮定」できればよいのであって、その仮定が妥当なものであれば問題ないのです。

要するにいかなる場合においても「等分散性を仮定しないt検定」を行うと良いということです。事前検定を行うことが、すでに検定の多重性にひっかかると考える人もいます(私もその立場にいます)。

> 正規分布に従わず、等分散でもない場合には、どのような検定方法を採用することになるのでしょうか?

明らかに正規分布に従っているとはいえないようば場合はウェルチの検定を行えば良いです。それは「歪みのある分布」と「一様な分布」のシミュレーショングラフを見れば分かりますね。
    • good
    • 5
この回答へのお礼

再びのご回答ありがとうございます。

>要するにいかなる場合においても「等分散性を仮定しないt検定」を行うと良いということです。
>明らかに正規分布に従っているとはいえないような場合はウェルチの検定を行えば良いです。

「等分散性を仮定しないt検定」=ウェルチの検定、であると理解しているのですが、それは間違っていますでしょうか?
そのため、t検定は正規分布に従っていない場合には使えないので、ウェルチの検定も不適当なのではないかと感じているのですが。いかがでしょうか?

何度もご質問してしまい申し訳ございませんが、何卒よろしくお願いします。

お礼日時:2008/01/24 15:27

まずサンプル数ではなくてサンプルサイズ、もしくは標本の大きさというのが正しいですね。

それから、サンプルサイズが大きければ良いということでもなくて、サンプルサイズが大きければ大した差がないのに有意差が認められるという結果が得られることがあります。これに関しては検出力(検定力)、パワーアナリシスを調べれば明らかになるでしょう。

それから、http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.h …の記事を読むと、質問者さんの疑問は晴れるでしょう。

この回答への補足

追加のご質問で申し訳ございませんが、
t検定は正規分布に従っている場合でないと使えないということで
正規分布への適合度検定をt検定の前に行おうと思っているのですが、
適合度検定では結局「正規分布に従っていないとはいえない」ということしか言えないと思いますが、「正規分布に従っていない」という検定結果にならない限り、t検定を採用してもよろしいことになるのでしょうか?

何卒よろしくお願いします。

補足日時:2008/01/24 08:02
    • good
    • 1
この回答へのお礼

ご回答ありがとうございます。

サンプル数ではなく、サンプルサイズなのですね。

参考記事を読ませていただきました。
これによると、2群のサンプルサイズがたとえ異なっていても、
またサンプルサイズが小さくても、それから等分散に関わらず、
基本的に等分散を仮定しない t 検定を採用するのが望ましいという
ことになるのでしょうか?

つまり、正規分布に従っている場合、サンプルサイズが小さくても基本的に等分散を仮定しない t 検定を採用し、正規分布に従わない場合に、ノンパラメトリックな方法であるマン・ホイットニーの U 検定などを採用すればよろしいということでしょうか?

また、マン・ホイットニーの U 検定は等分散である場合にしか使えないということだと理解したのですが、もし正規分布に従わず、等分散でもない場合には、どのような検定方法を採用することになるのでしょうか?

いろいろご質問してしまい申し訳ございませんが、
何卒よろしくお願いします。

お礼日時:2008/01/24 07:32

>サンプル数が少ないと信頼性に欠けるという話


推測統計学の性質上、サンプル数が多いほど良いのは事実です。理想は、全てのサンプルのデータを得ること。これは、必ず差がでます。1mmでも、1mgで大きいほうが、誰がやっても大きいのです。
 t検定は、「例数が少なくても」というのが特長です。有意差は、有れば「有意差が有る」と書け、説得力が少しは増すだけです。

 信頼性については、「いつくのサンプルなら絶対」というのは、ありません。経験的なもので、特にヒトの場合はいろいろな人がいるので、サンプル数が十分に大きくないと、なんぞが書かれていますが、どれだけなら十分かは客観的に、というのはありません。あくまでも確率です。
 実際、食品とガンとの関係で、味噌汁は、ガンになりにくい、なりやすい、なりにくい、と二転三転しています。

>無作為抽出=正規分布ということにはならない
 正確に言えば、無作為抽出をしないと、正規分布はしない、ということです。実際には、無作為抽出を無限解すれば、正規分布をする、というのが統計学の基礎です(教科書だと、はじめの部分に記述してある)。そうでないと、t検定根拠を失います。
 例外的に、無作為抽出をしても、「人の平均貯蓄額は、正規分布をしない」というのは有名です。
    • good
    • 1
この回答へのお礼

わざわざ何度もお付き合いしていただき、本当にありがとうございます。いろいろ大変勉強になります。

>無作為抽出を無限回すれば、正規分布をする。

ということは、サンプル数が20そこらである場合には、t検定を行う前に必ず正規分布に従っているかどうかを調べる必要があるということでしょうか?そのためには、適合度検定を行えばよろしいのでしょうか?

お礼日時:2008/01/23 22:31

>正規確率紙の方法


正規分布の場合だけならば
JIS Z 9041 -(1968)
3.3.4 正規確率紙による平均値および標準偏差の求め方
参照。注意点としては、右上がりの場合のみ正規分布であること。

傾きから他の分布であることも判断できますけど、ある程度のなれが必要です。既知の度数分布を引いてみれば見当つくでしょう。
    • good
    • 2
この回答へのお礼

ご回答ありがとうございます。

しかし、統計について分からない現時点の自分には理解できないです…。わざわざご回答下さったのに、申し訳ございません。

usokokuさんのおっしゃっていることを理解できるよう、
勉強に励みたいと思います。

お礼日時:2008/01/23 22:23

>T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く


t検定は、サンプル数が少なくてもokというのが特長です。私は動物実験をして、各群3匹、計6匹で有意差有との論文にクレームがついたことはありません。

>T検定を使用するためには、正規分布に従っている必要がある
 正規分布は、無作為抽出すればOKです。動物の場合は、無作為抽出と想定されますが、ヒトの場合は困難です。正規分布の判定は、正規確率紙の方法は見たことがありますが、知りません。

>U検定
U検定では、順番の情報しか使いません。10と1でも、2.3と1でも、順位はいずれも1番と2番です。10と1の方が差が大きいという情報は利用されていません。ですから、t検定よりも有意差はでにくいでしょう。しかしサンプル数が大きければt検定と同程度の検出力がある、と読んだことがあります。正規分布していることが主張できないのなら、U検定は有力な方法です。

>これも使う候補に入るのでしょうか
 検定は、どんな方法でも、有意差が有、と判定できれば良いのです。有意差が出やすい方法を選ぶのは、研究者の能力です。ただ、正規分布していないのにt検定は、ルール違反です。
    • good
    • 3
この回答へのお礼

ご回答ありがとうございます。

>t検定は、サンプル数が少なくてもokというのが特長です。

検定自体はサンプル数が少なくてもできるとは思いますが、サンプル数が少ないと信頼性に欠けるという話を聞いたのですが、いかがでしょうか?

>正規分布は、無作為抽出すればOKです。

無作為抽出=正規分布ということにはならないと思うのですが、これはどういう意味なのでしょうか?

お礼日時:2008/01/23 16:06

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報