統計について質問です。エクセルの統計で、マンホイットニのU検定をしました。あるテストの若年者群と高

Question

統計について質問です。

エクセルの統計で、マンホイットニのU検定をしました。あるテストの若年者群と高齢者群の正答率についてです。

正答率を小数点第一位までで検定を行いたかったのですが、エラーが起き、小数点以下を四捨五入して整数にすると上手くいきました。

マンホイットニは整数でないとできませんか？
教えていただきたいです。よろしくお願い致します！

kamiyasiro · Accepted Answer

企業で統計を推進する立場の者です。

マンホイットニー検定は、順位の良し悪しの検定です。
若者の方が、明らかに上位を占めるのであれば、差が有意であると出てきます。

一般に統計ソフトは内部で順位を作り出しているので、本来ならばスコアが小数点以下の数を含んでいても良いはずです。
私はエクセルは使わないのですが、エクセルの関数の引数が、そもそも順位値に直したものを与えないと動かないのかもしれません。
その場合は、そもそも現在の正答率を四捨五入して使うというのは間違いです。

stomachman · Answer

ノンパラメトリック検定の様々な方法は、どれも「(Fisherの）並べ替え検定」の代用品にすぎません。

「並べ替え検定」ってのは：例えば「若年者」というラベルが貼ってあるデータが5個と、「高齢者」というラベルが貼ってあるデータが5個ある。で、帰無仮説：「ラベルは全く無意味である」を検定します。「ラベルは全く無意味である」とは、「データにデタラメにラベルを貼っただけだ」ということです。だから、合計10個のデータの中から5個を選んで、何らかの統計量（例えば若年者群と高齢者群との平均値の差）を計算する。これを、10個のデータの中から5個を選ぶ選び方全部（10C5 = 252通り)について計算してみるんです。で、「実際に貼ってあるラベルの通りの選び方の場合」の統計量が「極端な値であって、そんなことは偶然には滅多におこらない」と言えるとき、帰無仮説を棄却する。そういう検定です。

ところが、データの数がちょっと多くなると、「選び方全部の場合の数」が膨大になって、到底実行不可能になります。（例えば「若年者」と「高齢者」のラベルがそれぞれ100個ずつなら200C100 ≒ 10^59 通り。）しょうがないんで、何か代用品を考えよう、ってことになりました。で、本来の「並べ替え検定」に比べて性能は悪いけれども、計算はうんと楽だ、という性質を持ついろんな方法が開発された。（例えば、データの順位の情報だけを使い、データの数値そのものは捨ててしまう。）

しかし、「選び方全部」について統計量の計算を実行する代わりに、「選び方全部の中からランダムに選び方を決めて、その場合の統計量を計算する」（具体的には、例えば 200個のデータから100個を乱数でランダムに選んでそれらを「若年者」、残りを「高齢者」とみなし、それぞれの平均値の差を計算する）ということを100万回とか1億回とか繰り返すことなら、コンピュータがあればごく簡単です。（Bootstrap法と言います。）その結果を使って「実際に貼ってあるラベルの通りの選び方」の場合の統計量が「極端な値であって、そんなことは偶然には滅多におこらない」ということになっているかどうかも簡単に判定できます。
　Bootstrap法も「並べ替え検定」の代用品ではありますが、他の（いわゆるノンパラメトリック検定の様々な）方法に比べて、シンプルで、本来の「並べ替え検定」に最も近く、データの情報を最大限に活かせる方法だということは、直感的にも納得できるんじゃないでしょうか。Excelの乱数は高品質の乱数発生法（メルセンヌツイスター）で実装されていますから、簡単なマクロを書けばbootstrap法を実行できます。

なので今時「性能は悪いけれども、計算はうんと楽」な方法なんか使う理由はないでしょう。

という状況でなお、あえてのマンホイットニのU検定？

統計について質問です。 エクセルの統計で、マンホイットニのU検定をしました。あるテストの若年者群と高

ノンパラメトリック検定の様々な方法は、どれも「(Fisherの）並べ替え検定」の代用品にすぎません。

企業で統計を推進する立場の者です。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

統計について質問です。エクセルの統計で、マンホイットニのU検定をしました。あるテストの若年者群と高