
ある2郡間の平均値において、統計的に有意な差があるかどうか検定したいです。ちなみに、対応のない2郡間での検定です。
T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く、サンプル数が少ない場合には、Mann-WhitneyのU検定を行うのが良いと聞いたのですが、それは正しいのでしょうか?
また、それが正しい場合には実際にどの程度のサンプル数しかない時にはMann-WhitneyのU検定を行った方がよろしいのでしょうか?
例えば、サンプル数が10未満の場合はどうしたらよろしいのでしょうか?
また、T検定を使用するためには、正規分布に従っている必要があるとのことですが、毎回正規分布に従っているか検定する必要があるということでしょうか?その場合には、コルモゴルフ・スミノルフ検定というものでよろしいのでしょうか?
それから、ノンパラメトリックな方法として、Wilcoxonの符号化順位検定というものもあると思いますが、これも使う候補に入るのでしょうか。
統計についてかなり無知です、よろしくお願いします。
No.7ベストアンサー
- 回答日時:
結局ですね、適切な検定というのは適切なp値が得られるということなんですよ。
適切なp値というのは第1種の過誤と第2種の過誤をなるべく低くするようにする方法を選ぶということなのですね。従来どおりの教科書には「事前検定をし、正規性と等分散性を仮定できたら、、、」と書いていありますが、そもそも事前検定をする必要はないというのが例のページの話なのです。どちらが正しいかというと、どちらも正しいのです。だから、ある研究者はマンホイットニーのU検定を行うべきだというかもしれませんし、私のようにいかなる場合においてもウェルチの検定を行う方がよいという者もいるということです。
ややこしく感じるかもしれませんが、もっと参考書を色々と読んで分析をしていくうちにこういった内容もしっくり来るようになると思います。
何度もお付き合い下さり、ありがとうございます。
なるほど、そういうことなのですね。納得しました。
いろいろ本当に勉強になりました。
もっといろいろな参考書を読んで勉強に励みたいと思います。
本当にありがとうございました。
No.6
- 回答日時:
> 「等分散性を仮定しないt検定」=ウェルチの検定、・・・
その通りです。
> ウェルチの検定も不適当なのではないかと感じているのですが。
例のページには元の分布が正規分布でない場合についても言及されていますでしょ?そういう場合でもウェルチの検定の方が良いということが書かれているはずです。
何度もご回答下さり、本当にありがとうございます。
>例のページには元の分布が正規分布でない場合についても言及されていますでしょ?そういう場合でもウェルチの検定の方が良いということが書かれているはずです。
確かにそのような感じに書かれていますね!しかし、かなり混乱しているのですが、t検定の前提は正規分布に従っているということなのですよね?ウェルチの検定を使えば、正規分布でなかろうが、関係ないということなのでしょうか?
申し訳ございませんが、よろしくお願いします。
No.5
- 回答日時:
> 「正規分布に従っていない」という検定結果にならない限り、t検定を採用してもよろしいことになるのでしょうか?
実際に母集団が正規分布に従っているかどうかは誰にも分かりません。あくまでも「仮定」できればよいのであって、その仮定が妥当なものであれば問題ないのです。
要するにいかなる場合においても「等分散性を仮定しないt検定」を行うと良いということです。事前検定を行うことが、すでに検定の多重性にひっかかると考える人もいます(私もその立場にいます)。
> 正規分布に従わず、等分散でもない場合には、どのような検定方法を採用することになるのでしょうか?
明らかに正規分布に従っているとはいえないようば場合はウェルチの検定を行えば良いです。それは「歪みのある分布」と「一様な分布」のシミュレーショングラフを見れば分かりますね。
再びのご回答ありがとうございます。
>要するにいかなる場合においても「等分散性を仮定しないt検定」を行うと良いということです。
>明らかに正規分布に従っているとはいえないような場合はウェルチの検定を行えば良いです。
「等分散性を仮定しないt検定」=ウェルチの検定、であると理解しているのですが、それは間違っていますでしょうか?
そのため、t検定は正規分布に従っていない場合には使えないので、ウェルチの検定も不適当なのではないかと感じているのですが。いかがでしょうか?
何度もご質問してしまい申し訳ございませんが、何卒よろしくお願いします。
No.4
- 回答日時:
まずサンプル数ではなくてサンプルサイズ、もしくは標本の大きさというのが正しいですね。
それから、サンプルサイズが大きければ良いということでもなくて、サンプルサイズが大きければ大した差がないのに有意差が認められるという結果が得られることがあります。これに関しては検出力(検定力)、パワーアナリシスを調べれば明らかになるでしょう。それから、http://aoki2.si.gunma-u.ac.jp/lecture/BF/index.h …の記事を読むと、質問者さんの疑問は晴れるでしょう。
この回答への補足
追加のご質問で申し訳ございませんが、
t検定は正規分布に従っている場合でないと使えないということで
正規分布への適合度検定をt検定の前に行おうと思っているのですが、
適合度検定では結局「正規分布に従っていないとはいえない」ということしか言えないと思いますが、「正規分布に従っていない」という検定結果にならない限り、t検定を採用してもよろしいことになるのでしょうか?
何卒よろしくお願いします。
ご回答ありがとうございます。
サンプル数ではなく、サンプルサイズなのですね。
参考記事を読ませていただきました。
これによると、2群のサンプルサイズがたとえ異なっていても、
またサンプルサイズが小さくても、それから等分散に関わらず、
基本的に等分散を仮定しない t 検定を採用するのが望ましいという
ことになるのでしょうか?
つまり、正規分布に従っている場合、サンプルサイズが小さくても基本的に等分散を仮定しない t 検定を採用し、正規分布に従わない場合に、ノンパラメトリックな方法であるマン・ホイットニーの U 検定などを採用すればよろしいということでしょうか?
また、マン・ホイットニーの U 検定は等分散である場合にしか使えないということだと理解したのですが、もし正規分布に従わず、等分散でもない場合には、どのような検定方法を採用することになるのでしょうか?
いろいろご質問してしまい申し訳ございませんが、
何卒よろしくお願いします。
No.3
- 回答日時:
>サンプル数が少ないと信頼性に欠けるという話
推測統計学の性質上、サンプル数が多いほど良いのは事実です。理想は、全てのサンプルのデータを得ること。これは、必ず差がでます。1mmでも、1mgで大きいほうが、誰がやっても大きいのです。
t検定は、「例数が少なくても」というのが特長です。有意差は、有れば「有意差が有る」と書け、説得力が少しは増すだけです。
信頼性については、「いつくのサンプルなら絶対」というのは、ありません。経験的なもので、特にヒトの場合はいろいろな人がいるので、サンプル数が十分に大きくないと、なんぞが書かれていますが、どれだけなら十分かは客観的に、というのはありません。あくまでも確率です。
実際、食品とガンとの関係で、味噌汁は、ガンになりにくい、なりやすい、なりにくい、と二転三転しています。
>無作為抽出=正規分布ということにはならない
正確に言えば、無作為抽出をしないと、正規分布はしない、ということです。実際には、無作為抽出を無限解すれば、正規分布をする、というのが統計学の基礎です(教科書だと、はじめの部分に記述してある)。そうでないと、t検定根拠を失います。
例外的に、無作為抽出をしても、「人の平均貯蓄額は、正規分布をしない」というのは有名です。
わざわざ何度もお付き合いしていただき、本当にありがとうございます。いろいろ大変勉強になります。
>無作為抽出を無限回すれば、正規分布をする。
ということは、サンプル数が20そこらである場合には、t検定を行う前に必ず正規分布に従っているかどうかを調べる必要があるということでしょうか?そのためには、適合度検定を行えばよろしいのでしょうか?
No.2
- 回答日時:
>正規確率紙の方法
正規分布の場合だけならば
JIS Z 9041 -(1968)
3.3.4 正規確率紙による平均値および標準偏差の求め方
参照。注意点としては、右上がりの場合のみ正規分布であること。
傾きから他の分布であることも判断できますけど、ある程度のなれが必要です。既知の度数分布を引いてみれば見当つくでしょう。
ご回答ありがとうございます。
しかし、統計について分からない現時点の自分には理解できないです…。わざわざご回答下さったのに、申し訳ございません。
usokokuさんのおっしゃっていることを理解できるよう、
勉強に励みたいと思います。
No.1
- 回答日時:
>T検定を行うには、ある程度のサンプル数(20以上程度?)があった方が良く
t検定は、サンプル数が少なくてもokというのが特長です。私は動物実験をして、各群3匹、計6匹で有意差有との論文にクレームがついたことはありません。
>T検定を使用するためには、正規分布に従っている必要がある
正規分布は、無作為抽出すればOKです。動物の場合は、無作為抽出と想定されますが、ヒトの場合は困難です。正規分布の判定は、正規確率紙の方法は見たことがありますが、知りません。
>U検定
U検定では、順番の情報しか使いません。10と1でも、2.3と1でも、順位はいずれも1番と2番です。10と1の方が差が大きいという情報は利用されていません。ですから、t検定よりも有意差はでにくいでしょう。しかしサンプル数が大きければt検定と同程度の検出力がある、と読んだことがあります。正規分布していることが主張できないのなら、U検定は有力な方法です。
>これも使う候補に入るのでしょうか
検定は、どんな方法でも、有意差が有、と判定できれば良いのです。有意差が出やすい方法を選ぶのは、研究者の能力です。ただ、正規分布していないのにt検定は、ルール違反です。
ご回答ありがとうございます。
>t検定は、サンプル数が少なくてもokというのが特長です。
検定自体はサンプル数が少なくてもできるとは思いますが、サンプル数が少ないと信頼性に欠けるという話を聞いたのですが、いかがでしょうか?
>正規分布は、無作為抽出すればOKです。
無作為抽出=正規分布ということにはならないと思うのですが、これはどういう意味なのでしょうか?
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 統計検定2級を学んでいるものです。 過去問で合格点を取れるようにまでは知識を身につけましたが。 母分 5 2023/03/20 23:21
- 統計学 理論値と実測値の検定方法 3 2022/04/19 09:32
- 統計学 統計学を学んでいるものです。 区間推定や検定において度々 t分布やカイ二乗分布、F分布が現れますが、 6 2023/02/15 14:26
- 統計学 統計学の問題です。よろしくお願いします。 ある部品の重量は正規分布に従うとされており,過去の経験から 1 2023/01/19 03:36
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 生物統計学の質問 3 2022/11/11 21:14
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 一変量分析(度数分布表)は、結果をもとに特に検定せずに断定してもよいですか? 7 2022/11/24 23:20
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
効果量のマイナス表示に関して
-
p値の計算式
-
統計学のP検定とt検定につい...
-
英語論文に出てくる「independe...
-
最小有意差とは?
-
同等性の検定について
-
【統計】2つデータが似ている...
-
平均値、標準偏差、変動係数に...
-
数学の質問です。 一枚の硬貨を...
-
重複順列
-
3個のサイコロを同時に1回振る...
-
2個のサイコロを同時に投げる時...
-
00~99、AA~ZZの組み合わせっ...
-
確率0.02%って10000人に2人です...
-
サイコロ3個を振った時の確立...
-
標準偏差の平均値の求め方
-
4つのサイコロを同時に振って...
-
【数学】2つのサイコロを振っ...
-
数学の質問です。 1〜6までの番...
-
確率
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
効果量のマイナス表示に関して
-
調査結果は、標準誤差率が何%...
-
統計学のP検定とt検定につい...
-
統計学的に信頼できるサンプル...
-
サンプルサイズの大きく違うF検定
-
p値の計算式
-
統計のt検定について
-
英語論文に出てくる「independe...
-
Mann-WhitneyのU検定をspss統計...
-
検定で出てしまった有意差を認...
-
回帰曲線の有意差の検定
-
T検定とMann-WhitneyのU検定の...
-
統計解析で何を用いればよいの...
-
検定の仕方教えて
-
shirley-williamsの方法とsteel...
-
回帰直線の傾きの比較
-
両側検定と片側検定の違い
-
t-検定(P<0.05で有意差あり):p...
-
スミルノフ・グラブス検定の有...
-
統計的検定法について
おすすめ情報