統計：検定とシミュレーション

Question

統計：検定とシミュレーション
統計を勉強している途中で出てきた素朴な疑問です。
統計学においては非常に多くの検定方法がでてきますが、「正規性」だとか「等分散性」だとかさまざまな制約がありますし（勿論ノンパラ手法もありますが）、そもそもの仮説の立て方にも違和感を覚えます。
そこでなんですが、例えば、取得した400サンプルのテスト点数データの平均値が前回の同テスト点数の平均値70点より高いといえるか、などという場合に、母平均の検定など使わず、その400サンプルから無作為に200サンプル抽出して平均値を得る、そしてそれを1万回PCで反復処理させてその1万個の平均値の平均値をとって理論値である70点と比較する、なんていうやり方ではダメなんでしょうか？個人的にはこのほうがしっくりくるのですが・・・。
同様の考え方で、分散分析や重回帰分析などもできないものかと考えています。
見当外れのことをいっていたら恥ずかしい限りですが、ご教授願います。

ur2c · Accepted Answer

計算機が発達するにしたがって、そういう考え方が出てきました。Resampling methods（再標本法）と言います。解説は
http://en.wikipedia.org/wiki/Resampling_%28statistics%29
にあり、日本語版はまだないみたいです。

ANo.1 で quaestio さんが紹介した bootstrap 法は代表的な resampling で、参考 URL に日本語の解説があります。Bootstrapping の語源はコンピュータの bootstrapping と同じで、
http://www.phrases.org.uk/meanings/290800.html
にあります。長靴の紐を自分で引っぱると、脚が上がる。もっと引っぱれば、もっと上がる。それでも更に引っぱれば、ついには体が宙に浮く。

> 検定方法 [...] さまざまな制約がありますし

Resampling の観点から見ると、昔ながらの統計が正規性などの仮定を設けるのは、計算力の代替に先験的な情報を補充しているのだ、ということになります。

> そもそもの仮説の立て方にも違和感を覚えます

賛成です。

仮説検定ぬきの、推定だけで統計学を構成する立場もあります。その先駆が赤池の情報量基準で、推定をパラメタの空間からモデル族の空間に拡張しました。

> 同様の考え方で、分散分析や重回帰分析などもできないものか

できます。

> 見当外れのことをいっていたら恥ずかしい

独力で resampling の考えに到達したのは、すばらしいと思います。

参考URL：http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%BC%E3%83%88%E3%82%B9%E3%83%88%E3%83%A9%E3%83%83%E3%83%97%E6%B3%95

quaestio · Answer

ブートストラップ法というあなたの考えに近い方法があります。

質問の事例の場合、次のようになるでしょう。
１．標本平均をm、帰無仮説の母平均をμ=70とし、標本値xi(i=1～400)を
zi = xi-m+μ
と変換する。
２．zi(i=1～400)から重複を許して無作為に400個のデータを抽出します。
２．抽出された400個のデータから平均zbarを求めます。
３．これをB回（数千回以上）繰り返し、zbarがm以上であった回数nを記録します。
４．n/B < 有意水準　であったら前回の平均70点よりも高いと結論付けます。

統計：検定とシミュレーション

計算機が発達するにしたがって、そういう考え方が出てきました。

ブートストラップ法というあなたの考えに近い方法があります。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング