
ご覧頂きありがとうございます。有意差検定についての質問です。正規分布していない二つの群について有意差検定を行う必要がありMann-Whitney検定を使っています。ですが、「比較する二つの群が等分散である必要があるとしている研究者もいる」(下記HPの内容を参照するようにとのこと)
http://qdai.way-nifty.com/qjes/2005/02/mannwhitn …
というご意見を頂いています。分散を比較すべきでしょうか。比較すべきであればどういった方法で行い、等しくない場合にはどの検定が使えるのでしょうか。
また、もうひとつ、今回2群のサンプル数が8倍くらい違います。90と700というような状況です。これについてはMann-Whitney検定を行うことに問題はないのでしょうか。
統計は今までほとんど使ってこなかったため付け焼刃の知識で解析しており間違った検定をしていないか心配です。ご回答よろしくお願いします。
No.4ベストアンサー
- 回答日時:
たびたび申し訳ありません。
Ansari-Bradely検定の記述をもう一度確認してみましたが,今回の場合では不適切ですね。Ansari-Bradely検定は,代表値が(ほぼ)等しい時に,散布度(分散)に違いがあるかどうかを調べる検定法です。
今回のように,代表値に違いがあるかどうかを調べる場合には,この方法は不適切ですね。
そうすると,等分散かどうかを調べるのならば……仕方ないので,一般によく使われる「F検定を用いた等分散の検定」(正式名称ではありません)を使うのはどうでしょう?
まあ,Ansari-Bradely検定で中央値が著しく異なる場合は,各条件の中央値をそれぞれ引いた値に対して,この検定を適用するなどの方法も考えられていますが……
なお,参考にした本は,既に絶版の「ノンパラメトリック法―新しい教育・心理統計」(岩原信九郎,1964年)です。
お礼が遅くなってしまい申し訳ありません。たびたびのご回答ありがとうございました。正規分布しないケースで等分散を検定する方法は難しいようですね。一応、F検定を用いると等分散は棄却されてしまいました。まだ、いい解決案が決まりませんが、どうにか乗り切れるように考えてみたいと思います。
No.3
- 回答日時:
今,思い出したのですが,Ansari-Bradely検定は,データ数がおおよそ等しいという検定の基本条件が守られていないと使えない検定法だった気がします。
だとすると,90と700というサンプル数が大きく食い違う今回では使えないのではないかな?とすると,このままでは検定にかけることができないと思います。
もし,私がこの論文の投稿者であるならば,次善策として,900データの中から90を無作為抽出して,データ数を同数にしてから,検定をかけることにします。あまり一般的ではないですが,検定の前提条件を守るという意味では仕方ないとしてこの方策をとります。
一般的ではないので,論文本文中において,どうしてそのような方略を取るかを説明しないといけないと思いますが。
その後は「Ansari-Bradely検定」→「Mann-Whitney検定」という方法も考えられますが,私ならば,一条件のデータ数が90であることから,仮にデータが正規分布をしていないとしても,平均値の標本分布は正規近似をするだろうという「中心極限定理」を持ち出して,通常のt検定を行います(その際,分散が等質でなければ「Welch修正のt検定」を使います)。
以前指摘したようにデータ数の食い違いの大きさがネックになっていますので,これをどうにかしないといけないと思います。
繰り返しますが,上記アドバイスはあくまでも個人的意見にすぎないことに注意してください。なお,Ansari-Bradely検定の計算式がのっている説明サイトは私自身は見たことはありません。
No.2
- 回答日時:
再度登場です。
論文審査者からのコメントとして指摘されたならば,そのコメントに丁寧に対応するのが良いと思います。
> 「Ansari-Bradely検定で等分散を確認した」
検定を行った上で,このような記述を補足した方が良いと思います。
気になる点は,「本当に等分散であるという結果が得られるか」,「いずれにしろデータ数が大きく違うのではないか」です。前者は実際に検定をしてみればよいですが,これで等分散でないのならば,マン・ホイトニー検定は使えないことになります。更に条件が緩い「中央値検定」に切り替える必要があるかもしれません。
しかし,どのような方法を使うにしろ,データ数の違いはつっこみどころなので,予め補足をした方がよいかもしれません(「本来なら,検定は同数データが基本となるが,○○の理由から,同数データを確保することができなかった」など)。あるいは,データ数が多い条件から,改めて無作為抽出を行って少ない条件の人数に合わせるという方法も考えられます。後者は私案であり,一般的に使われている手法ではないことに注意してください。
論文審査コメントへの対処法には「絶対」というものはありませんので,あくまでも私感を述べさせていただきました。
たびたびのご回答ありがとうございます。確かに、等分散が仮定できるかかなり怪しいことと、「Ansari-Bardely検定」に関する記述がネットでは見つからないという問題が残っています。もし、記述のあるサイトや本を教えていただければ幸いです。時間がないのでできればネットがいいのですが。。。よろしくお願いします。
No.1
- 回答日時:
こんにちは。
Mann-Whitney検定の前提条件を挙げるとすれば,二条件の各変数の分散が等しいと仮定できる(等分散)と,二条件のデータ数がほぼ等しいということがあげられるでしょう……ただし,この二つの前提条件は,Mann-Whitney検定のみならず,t検定,分散分析,多重比較,その他のノンパラメトリック検定など,多くの検定法の前提条件となっています。取り立てて,Mann-Whitney検定だけに当てはまる前提条件ではないので,数理統計学の教科書ではわざわざ指摘されることがないのだと思います。
ただし,実際の分析データには上記の前提条件を満たせない場合も多く,データ数が一方の変数の二~三倍という場合にも強引に適用しているものもありますが,統計学的には不適切な適用法だと言います(多重比較法の中にデータ数が等しくなくても使えるという手法がありますが,それにしても限度があります)。なので
> 今回2群のサンプル数が8倍くらい違います。90と700というような状況です。これについてはMann-Whitney検定を行うことに問題はないのでしょうか。
あります。統計学的には「データを追加して,同数になるようにしてください」というアドバイスが適切でしょう。ただし,実際のデータ分析では強引に適用していることが多々ありますが,「統計学的には不適切だが,現実的に仕方ない」としているだけなので注意してください。
なお,等分散を検定したいのであれば,マイナーな手法ですが「Ansari-Bradely検定」というものが使えます。これの説明文章を探すのが一苦労だと思いますが。
早速のご回答ありがとうございます。勉強になりました。実は論文投稿中でして、もっと前に気がつくべきでした。もし、このままの検定の方法で投稿するとした場合なのですが、「Mann-Whitney検定を行う条件として、正規分布していないからというだけではこの検定を適用する条件として説明が不十分ではないか。母集団が等分散と仮定したなど二つの群の有する性質を示すべきではないか」との指摘がありました。質問での「」内の説明と同じ方からの指摘です。例えば、教えていただいた「Ansari-Bradely検定で等分散を確認した」などの記述をすべきなのでしょうか。インターネットなどでMann-Whitney検定を使っているケースを調べても、大抵「正規分布していないから適用した」程度のものばかりなので困っています。もし、ご意見ありましたらよろしくお願いします。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 t検定を繰り返してはいけない理由について教えて下さい。 2 2022/05/15 12:37
- 統計学 一変量分析(度数分布表)は、結果をもとに特に検定せずに断定してもよいですか? 7 2022/11/24 23:20
- 英語 Mann-Whitney U test was used for statistical analy 2 2022/10/06 14:04
- 統計学 t検定について教えてください 2 2023/02/23 16:35
- 統計学 生物統計学の質問 3 2022/11/11 21:14
- 統計学 アンケート調査のデータ比較をする際の統計分析方法の選択に迷っています 5 2022/04/15 01:05
- 一戸建て アスベスト物件解体に必要なこと 2 2023/07/12 07:10
- 電気・ガス・水道業 簡易専用水道の定期清掃について 3 2023/03/26 16:36
- 統計学 統計学を学んでいるものです。 区間推定や検定において度々 t分布やカイ二乗分布、F分布が現れますが、 6 2023/02/15 14:26
- 統計学 統計でこの問題わかる方、教えて下さいm(_ _)m 「会社に就職した。出張でルートAで行くと、31 2 2022/07/17 09:44
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
効果量のマイナス表示に関して
-
統計学のP検定とt検定につい...
-
統計解析で何を用いればよいの...
-
Mann-WhitneyのU検定をspss統計...
-
官能検査の統計処理について
-
統計学(独立性の検定とオッズ...
-
T検定とMann-WhitneyのU検定の...
-
統計のt検定について
-
検定の仕方教えて
-
最小有意差とは?
-
調査結果は、標準誤差率が何%...
-
統計学的に信頼できるサンプル...
-
t検定・Χ二乗検定について t...
-
4択一の50問100点満点の問題を...
-
数学の問題で4C0の答えを教えて...
-
2つのサイコロの目の合計が偶数...
-
統計学の問題なんですが・・・
-
4つのサイコロを同時に振って...
-
3個のサイコロを同時に1回振る...
-
サイコロ5個を同時に投げて任意...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
効果量のマイナス表示に関して
-
統計学のP検定とt検定につい...
-
調査結果は、標準誤差率が何%...
-
p値の計算式
-
統計のt検定について
-
統計学的に信頼できるサンプル...
-
サンプルサイズの大きく違うF検定
-
Fisherの正確確率検定とカイ二...
-
最小有意差とは?
-
検定で出てしまった有意差を認...
-
統計的検定法について
-
有意差が無いことを証明(危険...
-
英語論文に出てくる「independe...
-
スミルノフ・グラブス検定の有...
-
Mann-WhitneyのU検定をspss統計...
-
エクセルを使いABCDの中で...
-
統計論文:ノンパラメトリック...
-
SPSS McNemar検定
-
Excelでスミルノフ・グラッブス...
-
shirley-williamsの方法とsteel...
おすすめ情報