検定統計量について

Question

検定統計量と検定について（http://www.aoni.waseda.jp/abek/document/t-test.html）

１．
検定の方法は，T検定，F検定，J検定などの手法をみかけるのですが，違いがいまいち
分かりません．これらの違いは，考える確率分布が違うということなのでしょうか？

２．
各検定法（T検定，F検定，J検定など）と検定統計量のかかわりがよくわからないのですが，
たとえば，T検定をする場合の平均の検定統計量とF検定をする場合の平均の検定統計量
は同じなのでしょうか？
　
３．
検定についてまだよく分かっていないので，検定の仕方を正しく認識しているか怪しいですが，
検定は，仮説に応じて検定統計量を定義してから，その検定統計量を計算し，
P値を求めることで仮説が有意か否か判定するのですよね？
なので，最終的にどの検定（T，F，J検定）もP値を求めて有意か否か判定するので，
検定統計量さえ正しく定義できれば，T検定，F検定，J検定など，どの検定法
を使おうとひとつの検定の方法でどんな仮説の検定もできると考えてよいのでしょうか？
それとも用途に応じて検定法を使い分ける必要があるのでしょうか？


回答よろしくお願いします。

cametan_42 · Accepted Answer

ええと……難しい質問ですねえ。
参考サイトも見せてもらったんですが、極論、「本買って読んで勉強してみる」ってのが一番確実な気がします。一旦ある程度の「壁」を越えると「何だ、そう言う意味か」って氷解する可能性があるから、なんです。
こればっかりはWeb検索でどうこうしよう、としない方が良いです。
それでですね……冗談か、と思うかもしれませんが、今まで色々な統計関係の本見てきましたが、その「最初の壁を越える」には次の本が最適です。

マンガでわかる統計学:
http://ssl.ohmsha.co.jp/cgi-bin/menu.cgi?ISBN=4-274-06570-7

この一冊で「統計学のすべてが分かる」とは言いませんが、最初の壁を「壊す」には最適です。ウソ!って思うかもしれませんが本当ですよ。
立ち読みで良いんで試してみてください。

＞検定の方法は，T検定，F検定，J検定などの手法をみかけるのですが，違いがいまいち分かりません．これらの違いは，考える確率分布が違うということなのでしょうか？

考える確率分布が違う、のではなくて「利用する確率分布が違う」と言うのが本当のところです。何故なら検定「したい」対象が違うから、ですよね。
(ただし、J検定、ってのは僕は聞いた事ありません。ひょっとしたらあるのかもしれませんが。)

＞各検定法（T検定，F検定，J検定など）と検定統計量のかかわりがよくわからないのですが，たとえば，T検定をする場合の平均の検定統計量とF検定をする場合の平均の検定統計量は同じなのでしょうか？

F検定は「分散の比」を検定統計量として用いるので全然違いますね。F検定は今のとこ「分散の差(実際は比を使ってますが)」を検出する為の技法だ、と思っててください。この場合、平均は関係無いです。

＞用途に応じて検定法を使い分ける必要があるのでしょうか？

その通りです。用途によって検定法は変わってきます。
P値、ってのはあくまで(理論上の)確率の事なんで、「確率を用いて仮説が有意か否か」判定するから、と言って、それが「全て使うべき分布が同じだ」と言う事にはなりません。

backs · Answer

>　これらの違いは，考える確率分布が違うということなのでしょうか？

その通りです。t検定というのはt分布を利用した検定の総称ですから、（前後の文脈で分かりますが）単にt検定といっても何を検定したのか意味不明なので適切な表現ではないわけです。正確には「独立2標本の平均値の差の検定」などというべきですね。

>　T検定をする場合の平均の検定統計量とF検定をする場合の平均の検定統計量
は同じなのでしょうか？

違います。t統計量はt分布のどこかにその検定量が落ちる（存在する）と仮定して計算されたもの。F統計量はF分布のどこかにその検定量が落ちると仮定して計算されたもの。

>　それとも用途に応じて検定法を使い分ける必要があるのでしょうか？

平均値の検定（たとえば独立2標本の平均値の差の検定）は"t検定"でも"F検定（いわゆる分散分析をすることになる）"でも用いることができます。

ではどちらを用いるのがよいか？ということについては、パワーアナリシスの範疇に含まれる問題です。

最初にいったように、t検定とかF検定というのは総称ですから、きちんと「何について検定するのか」ということをハッキリさせておかないと

>　ひとつの検定の方法でどんな仮説の検定もできると考えてよいのでしょうか？

という曖昧な疑問が出てしまうわけですね。これを解決するためには、常に「独立1標本の平均値の検定」はt統計量を求めればよい、とか「2群の等分散性の検定」はF統計量を求めればよい、という理解の仕方をすればよいわけです。

cametan_42 · Answer

＞このノンパラメトリック検定のブートストラップ法では，検定統計量を考えずに，対象とするパラメータ（平均や分散など）を生のまま検定に使用しています。

う～～ん……「検定統計量を考えずに」って事は無いですね。と言うかそもそも「検定統計量」って何だと思いますか?
極端に言うと、「平均」とか「分散」も「検定統計量」なんですよ。ただし、「平均」「分散」だとそのままじゃ使いづらい。そしてそれらの「量」が形作る「理論的確率分布」の形が見えない、ってんでそれらを弄くっていわゆる「検定統計量」と言う計算値を作り出している、んです。これが理論分布の成立背景ですね。
基本的に、この辺の「歴史的流れ」ってのをあまり統計学の教科書では事細かに説明してないんで「見えづらい」んですよ。全部「天下り」で公式適用して終わり、って事になっちゃってるので。

＞これは，リサンプリングによって確率分布を近似しているから（たとえばT検定のt分布）だと考えています。

いやいや。
例えば……そうだなあ。
t分布ってのは検定統計量tを正規分布が母集団の集合から「リサンプリング」するとああ言う分布になってる、って事を言ってるわけですよ。つまり、実際に「リサンプリングに於けるシミュレーション」をしてみると、「理論分布が浮かび上がる」。F分布も成立背景は同じなんです。
つまり、「検定」ってのは事実上シミュレーションで、単に「理論分布が分かっているから」実際何度もサンプリングする手間を省いた、ってだけなのです。「1回やっただけでシミュレーション結果が分かっちゃう」ってのが理論分布を用いた検定のツボなんですね。
一方、例えば、今サンプリングしようとしている「任意量」が形作る「理論分布」が分からない場合はどうすんだ?ってのが「ブートストラップ法」の出番なんですね。極端に言うと「実際に何度もサンプリングしてみる」と。ある意味極めて原始的な方法なんですよ。
そうなると、「効率的な」統計量として何を用いるか、も分かりませんし、それが形作る「確率分布」も分からないところで、「闇雲に何千回も実験してみる」ってのがブートストラップ法等のリサンプリング系の行動原理なのです。これは……手間考えるのなら、「普通の検定」用いた方が早いんですよ(笑)。ある程度母集団の確率分布がどう言う形してるか分かってるなら「普通の検定」の方がメンド臭くない、んです。
基本的に、ノンパラメトリック手法、って言われるものは、今書いて来たように「分からない、分からない、分からない」中でどうすんのか?と言う方法論なんですね。もちろん色々な研究成果は出てきていますが、平たく言うと、「パラメトリックではどうしようも無い」んで、「ほな、ノンパラで行ってみまひょか」って事なんです。出来ればみんな「パラメトリックで済ませたい」んですよ(笑)。ラクだから(笑)。また、理論的な展開考えてみても「分からない、分からない、分からない」んだったら、結局「確実度として言うと、パラメトリックより"劣る"結果になるんじゃないの?結果やっぱり"分かんない"んじゃないの?そんなの信頼性あんの?」と言う疑問が出てきて当たり前、です。つまり、確実性から言うと「パラメトリック手法より劣る」んです。理論分布が"分かっている"パラメトリック手法と"そんなもの分からん"ノンパラだと、「言う事に付いての確実性」が違う、ってのは分かるでしょうか?「分からん」状態から「分かる」結果をあぶり出すのは難しいですし、だからこそ長い間「分からん事に対してはどの道確実な事は何も言えないでしょ?」とノンパラの研究が立ち上がりづらかったのです。

＞それならば，これの方が汎用性があっていいと思っているのですが。

確かに「汎用性」って意味では原始的である、って事で「汎用性はある」んです。ただし、精度に疑問がある。
検定の大きな目的は「ある精度で断定した結論を出すこと」なんですよ。それがなければそもそも検定をする意味が無い。よって「検定手法」ってのは結果の信頼性が高ければ高い程良い、んですね。
ノンパラ等を使うのは、今のとこ、「追い詰められて」です。「背景情報がとにかく分からない中で」ある程度の事を言う為にはどうすりゃエエの?って苦肉の策で出てきた手法ですし、また、研究中の分野なんで、勇んで使うのはアブないと思いますよ。
よっぽど調べようとしている母集団の分布が歪で何か見た事ないような分布じゃない限り、普通に考えるとあまり出番は無い手法だとは思います。

検定統計量について

ええと……難しい質問ですねえ。

この回答への補足

> これらの違いは，考える確率分布が違うということなのでしょうか？

＞このノンパラメトリック検定のブートストラップ法では，検定統計量を考えずに，対象とするパラメータ（平均や分散など）を生のまま検定に使用しています。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

>　これらの違いは，考える確率分布が違うということなのでしょうか？