No.2
- 回答日時:
ノンパラメトリック検定の様々な方法は、どれも「(Fisherの)並べ替え検定」の代用品にすぎません。
「並べ替え検定」ってのは:例えば「若年者」というラベルが貼ってあるデータが5個と、「高齢者」というラベルが貼ってあるデータが5個ある。で、帰無仮説:「ラベルは全く無意味である」を検定します。「ラベルは全く無意味である」とは、「データにデタラメにラベルを貼っただけだ」ということです。だから、合計10個のデータの中から5個を選んで、何らかの統計量(例えば若年者群と高齢者群との平均値の差)を計算する。これを、10個のデータの中から5個を選ぶ選び方全部(10C5 = 252通り)について計算してみるんです。で、「実際に貼ってあるラベルの通りの選び方の場合」の統計量が「極端な値であって、そんなことは偶然には滅多におこらない」と言えるとき、帰無仮説を棄却する。そういう検定です。
ところが、データの数がちょっと多くなると、「選び方全部の場合の数」が膨大になって、到底実行不可能になります。(例えば「若年者」と「高齢者」のラベルがそれぞれ100個ずつなら200C100 ≒ 10^59 通り。)しょうがないんで、何か代用品を考えよう、ってことになりました。で、本来の「並べ替え検定」に比べて性能は悪いけれども、計算はうんと楽だ、という性質を持ついろんな方法が開発された。(例えば、データの順位の情報だけを使い、データの数値そのものは捨ててしまう。)
しかし、「選び方全部」について統計量の計算を実行する代わりに、「選び方全部の中からランダムに選び方を決めて、その場合の統計量を計算する」(具体的には、例えば 200個のデータから100個を乱数でランダムに選んでそれらを「若年者」、残りを「高齢者」とみなし、それぞれの平均値の差を計算する)ということを100万回とか1億回とか繰り返すことなら、コンピュータがあればごく簡単です。(Bootstrap法と言います。)その結果を使って「実際に貼ってあるラベルの通りの選び方」の場合の統計量が「極端な値であって、そんなことは偶然には滅多におこらない」ということになっているかどうかも簡単に判定できます。
Bootstrap法も「並べ替え検定」の代用品ではありますが、他の(いわゆるノンパラメトリック検定の様々な)方法に比べて、シンプルで、本来の「並べ替え検定」に最も近く、データの情報を最大限に活かせる方法だということは、直感的にも納得できるんじゃないでしょうか。Excelの乱数は高品質の乱数発生法(メルセンヌツイスター)で実装されていますから、簡単なマクロを書けばbootstrap法を実行できます。
なので今時「性能は悪いけれども、計算はうんと楽」な方法なんか使う理由はないでしょう。
という状況でなお、あえてのマンホイットニのU検定?
No.1ベストアンサー
- 回答日時:
企業で統計を推進する立場の者です。
マンホイットニー検定は、順位の良し悪しの検定です。
若者の方が、明らかに上位を占めるのであれば、差が有意であると出てきます。
一般に統計ソフトは内部で順位を作り出しているので、本来ならばスコアが小数点以下の数を含んでいても良いはずです。
私はエクセルは使わないのですが、エクセルの関数の引数が、そもそも順位値に直したものを与えないと動かないのかもしれません。
その場合は、そもそも現在の正答率を四捨五入して使うというのは間違いです。
この回答へのお礼
お礼日時:2020/10/01 20:31
ありがとうございました。
小数点以下の数を含んでも大丈夫、と分かって安心しました!もう少し試行錯誤してみようと思います!!(*^-^*)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 t統計量とF統計量について 9 2023/01/05 14:23
- 統計学 統計学 このデータはある母集団からとった標本である 42 41 48 40 45 37 43 47 4 2022/12/23 01:29
- 統計学 t検定について教えてください 2 2023/02/23 16:35
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 統計学の問題です。よろしくお願いします。 ある部品の重量は正規分布に従うとされており,過去の経験から 1 2023/01/19 03:36
- 数学 高校の数学Bの、確率分布と統計的な推測の、 正規分布の問題でわからない箇所がございます。問題文が、 2 2022/03/27 20:57
- 統計学 統計学の質問【有意水準0.05での統計的仮説検定】 2 2023/05/09 00:11
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
応答で層別した場合の検定について
-
EXCELにてローパスフィルタを作...
-
心理機能診断をしたのですが、...
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
脳波(EEG)の周波数は0.5~60Hzで...
-
検量線の決定係数について
-
極値をもつ時と持たない時、単...
-
ポアソン回帰でのカウントデー...
-
検定統計量の値がマイナス
-
統計学 カイ二乗検定とt検定の...
-
数3の複素数です 12分の25πが12...
-
t検定の使いどころ
-
片対数グラフで…
-
両対数グラフでの直線式の求め方
-
高校 数学 aを実数の定数とする...
-
最小二乗法を反比例の式を元に...
-
t検定の記述の仕方を教えてくだ...
-
パイロットサンプルって何ですか?
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
x^2+y^2はどのような分布をする?
-
検定統計量の値がマイナス
-
統計について
-
【統計】有意に「高い」?「低...
-
統計学の基本的なことについて...
-
最小二乗法を反比例の式を元に...
-
心理学の統計について
-
ポアソン回帰でのカウントデー...
-
[Excel] リストからの無作為抽出
-
対数グラフの対数とは・・・?
-
極値をもつ時と持たない時、単...
-
対数目盛の読み方を教えてください
-
溶解度の問題 理科
-
正規分布について
おすすめ情報