統計について質問です。詳しくはクラスカル・ウォリス検定の多変量拡張について質問です。
クラスカル・ウォリス検定はノンパラメトリックな3群以上の多標本で中央値の差を検定する方法だと思うのですが、1つの変量でのみ使えることは分かっています。
例えば、学校に3クラスあったとして3クラスごとにそれぞれ30人の体重を計測したとして、3クラス間に有意に差があるかどうかは検定できますよね。
しかし、3クラスそれぞれ30人ごとの身長と体重を計測したとして、3クラス間に有意に差があるかどうかというのは検定できるのでしょうか。つまり、クラスカルウォリス検定を多変量に拡張することは可能でしょうか。
もしそれが可能であれば、その方法についても具体的に教えていただけるとありがたいです。ネットで調べましたが載っていませんでしたので...
統計学について詳しく学んだことがなく、初心者ですが、よろしくお願いします。
No.2
- 回答日時:
多次元の場合は、各軸の順位値を、マンハッタン距離を使ってスカラー化すれば良いと思います。
それで同順位が出ても、そのまま解析すれば良いと思うのですが、いかがでしょうか。
順位に変換する前の計量値のまま、ユークリッド距離を使ってスカラー化し、その後順位に直すことも考えたのですが、それは身長・体重だから良しとなるけれど、そもそも、この検定を使う目的は、服飾に関する好みの順位や、ホームページの分かりやすさの順位みたいな、そもそも計量化できないケースにおいて、その順位を利用する検定ですからね。
あと、あまりに多次元の場合は、キャンベラ距離の方が良いかもしれません。ただ、計算は面倒です。
No.1ベストアンサー
- 回答日時:
ノンパラメトリック法の基本原理は、Fisherの並べ替え法です。
帰無仮説「どのクラスも同じ母集団からのサンプルだ」を考えます。言い換えれば「クラス分類は無意味。90個のデータを、ランダムに、30個ずつA,B,Cの3つのクラスに分けただけに過ぎない」ってことです。そこで、90個のデータを30個ずつA,B,Cの3つのクラスに分けるあらゆる組み合わせについて、何か適当な統計量(なんでもいいんですが、例えばAクラス,Bクラスそれぞれの平均値の差とか)を計算する。そうして得た統計量の分布の中で、実際のデータにおけるその統計量がどこに来るか。もし極端に端っこに来れば(つまりp値が小さければ)、帰無仮説が棄却でき、つまり「どのクラスも同じ母集団からのサンプルだ、ということはない」と結論が出せる。また、もし帰無仮説が棄却できなければ、帰無仮説はその名の通り、無に帰す。すなわち、「この統計量を調べても、何も言えなかった」ということになる。以上が基本原理です。しかし現実に「あらゆる組み合わせ」を生成しようとすると、余りにも膨大で到底実行不可能である。なので、手計算でなんとかなる程度の計算で済む代替法をいろいろ考えたのがノンパラメトリック法の様々な手法。所詮は代替なので、基本原理に比べれば、性能は劣るし、余計な仮定が必要になったりすることもあるわけです。で、そのような代替手法の一つがご質問の方法です。
でも、今ではコンピュータがあるんから、そんなカビの生えたやり方は必要ない。計算統計学的な手法が使えます。すなわち、30サンプル×3クラス分、90個のデータから、ランダムに30個をAクラス、30個をBクラス、残りをCクラスと分けて統計量を計算する、という処理を100万回ぐらい繰り返して、統計量の分布を作りますと、これは「基本原理の通りに全部の組み合わせで調べた統計量の分布」を良く近似しているんで、p値の良い推定値が直接計算できる。
で、ご質問の場合には、2成分のベクトルから「何か適当な統計量」を(好きなように)こしらえればいいんです。もちろん、それがどんなものなのかによっては帰無仮説が棄却できないかもしれない。(例えば、「Aクラスのサンプル数とBクラスのサンプル数の差」という統計量を計算すると、これは必ず0なので、当然、帰無仮説が棄却されることはない。)その場合は「この統計量を調べても、何も言えなかった」が結論です。けれども、別の「適当な統計量」ならば棄却できるかもしれない。どんな「適当な統計量」であれ、帰無仮説が棄却されれば、つまり「違いがある」と言えるわけです。
ご回答ありがとうございます。ノンパラメトリック法の基本原理が分かりました。多変量については自分で決めた統計量を用いる他なさそうですね。ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 どの統計を使えばいいのか教えてください(EZ-Rを使用) 5 2022/10/11 13:28
- 統計学 t統計量とF統計量について 9 2023/01/05 14:23
- 統計学 t検定について教えてください 2 2023/02/23 16:35
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 統計学の問題です。よろしくお願いします。 ある部品の重量は正規分布に従うとされており,過去の経験から 1 2023/01/19 03:36
- 中途・キャリア さて、社会人になってから13年目。 今まで、機械設計、機械製品の品質管理、部門の経営企画をやってきま 4 2023/07/17 08:59
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 物理学 質量とは何か? 6 2023/04/17 20:44
- 統計学 統計量および正規分布と分散の加法性の演習問題です。 5 2023/07/29 10:46
- 統計学 母平均の検定(両側t検定)の問題 2 2023/03/14 20:02
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
脳波(EEG)の周波数は0.5~60Hzで...
-
エクセルのグラフから半値幅を...
-
ポアソン回帰でのカウントデー...
-
心理機能診断をしたのですが、...
-
数3の複素数です 12分の25πが12...
-
統計について
-
下の対数表示のグラフから低域...
-
x^2+y^2はどのような分布をする?
-
法学検定アドバンストはどのく...
-
検量線の決定係数について
-
パイロットサンプルって何ですか?
-
エクセルでランダム関数で乱数...
-
EXCELにてローパスフィルタを作...
-
t検定の使いどころ
-
[Excel] リストからの無作為抽出
-
ナイキスト周波数に関して
-
検定の質問です。 有意水準5%、...
-
フーリエ変換の質問です。 一定...
-
単回帰分析と重回帰分析の結果...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
x^2+y^2はどのような分布をする?
-
検定統計量の値がマイナス
-
統計について
-
【統計】有意に「高い」?「低...
-
統計学の基本的なことについて...
-
最小二乗法を反比例の式を元に...
-
心理学の統計について
-
ポアソン回帰でのカウントデー...
-
[Excel] リストからの無作為抽出
-
対数グラフの対数とは・・・?
-
極値をもつ時と持たない時、単...
-
対数目盛の読み方を教えてください
-
溶解度の問題 理科
-
正規分布について
おすすめ情報