統計:検定とシミュレーション
統計を勉強している途中で出てきた素朴な疑問です。
統計学においては非常に多くの検定方法がでてきますが、「正規性」だとか「等分散性」だとかさまざまな制約がありますし(勿論ノンパラ手法もありますが)、そもそもの仮説の立て方にも違和感を覚えます。
そこでなんですが、例えば、取得した400サンプルのテスト点数データの平均値が前回の同テスト点数の平均値70点より高いといえるか、などという場合に、母平均の検定など使わず、その400サンプルから無作為に200サンプル抽出して平均値を得る、そしてそれを1万回PCで反復処理させてその1万個の平均値の平均値をとって理論値である70点と比較する、なんていうやり方ではダメなんでしょうか?個人的にはこのほうがしっくりくるのですが・・・。
同様の考え方で、分散分析や重回帰分析などもできないものかと考えています。
見当外れのことをいっていたら恥ずかしい限りですが、ご教授願います。
No.2ベストアンサー
- 回答日時:
計算機が発達するにしたがって、そういう考え方が出てきました。
Resampling methods(再標本法)と言います。解説はhttp://en.wikipedia.org/wiki/Resampling_%28stati …
にあり、日本語版はまだないみたいです。
ANo.1 で quaestio さんが紹介した bootstrap 法は代表的な resampling で、参考 URL に日本語の解説があります。Bootstrapping の語源はコンピュータの bootstrapping と同じで、
http://www.phrases.org.uk/meanings/290800.html
にあります。長靴の紐を自分で引っぱると、脚が上がる。もっと引っぱれば、もっと上がる。それでも更に引っぱれば、ついには体が宙に浮く。
> 検定方法 [...] さまざまな制約がありますし
Resampling の観点から見ると、昔ながらの統計が正規性などの仮定を設けるのは、計算力の代替に先験的な情報を補充しているのだ、ということになります。
> そもそもの仮説の立て方にも違和感を覚えます
賛成です。
仮説検定ぬきの、推定だけで統計学を構成する立場もあります。その先駆が赤池の情報量基準で、推定をパラメタの空間からモデル族の空間に拡張しました。
> 同様の考え方で、分散分析や重回帰分析などもできないものか
できます。
> 見当外れのことをいっていたら恥ずかしい
独力で resampling の考えに到達したのは、すばらしいと思います。
参考URL:http://ja.wikipedia.org/wiki/%E3%83%96%E3%83%BC% …
御礼が遅くなりました。
お返事、有難うございました。
>Resampling の観点から見ると、昔ながらの統計が正規性などの仮定を設けるのは、計算力の代替に先験的な情報を補充しているのだ、ということになります。
確かに。
しかし、ブートストラップ法に関する本をななめ読みしてみましたが、一言。
「難しい!」
というか、
「またこれだけ覚えにゃならんの!?」
という感じでした。
また、ただPCなどという便利なものができたから、というだけでは、先人の知恵を乗り越えることができないものだな、などと思いました。科学が進んだから、より統計学も前進した、なんていえないんですね(まあ、科学も「宗教」の一種ですから)。
>仮説検定ぬきの、推定だけで統計学を構成する立場もあります。その先駆が赤池の情報量基準で、推定をパラメタの空間からモデル族の空間に拡張しました。
すみません。このコトバが理解できるほどに勉学ができておりません。
とりあえず、イメージはわかるような気がします。
んー。とりあえずもっと勉強してみます。
有難うございました。
No.1
- 回答日時:
ブートストラップ法というあなたの考えに近い方法があります。
質問の事例の場合、次のようになるでしょう。
1.標本平均をm、帰無仮説の母平均をμ=70とし、標本値xi(i=1~400)を
zi = xi-m+μ
と変換する。
2.zi(i=1~400)から重複を許して無作為に400個のデータを抽出します。
2.抽出された400個のデータから平均zbarを求めます。
3.これをB回(数千回以上)繰り返し、zbarがm以上であった回数nを記録します。
4.n/B < 有意水準 であったら前回の平均70点よりも高いと結論付けます。
御礼が遅くなりました。
具体的にご説明いただき有難うございました。
>ブートストラップ法というあなたの考えに近い方法があります。
はい。名前だけは知っていました。
>1.標本平均をm、帰無仮説の母平均をμ=70とし、...
なるほど。
やっぱり、『検定』になっちゃうわけですね...。
確かに、ブートストラップといっても、やっていることは事前に想定される理論分布を経験分布に置き換えるだけであって、『検定』することに変わりはありませんもんね。
しかし、ブートストラップ法に関する本をななめ読みしてみましたが、ケースによってさまざまな手法があり、なかなか大変そうです。改めて勉強するならノンパラ法で逃げたほうがラクかも...とか思いました。大体、私自身確率論の基礎を理解できてないですし...。
事前分布が想定されない場合の一手段として理解しておこうかな、と思います。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 高校受験 夏休み、本気で勉強を頑張りたい 2 2022/07/03 16:33
- 高校 高校のテストの高得点 3 2023/05/24 21:04
- 統計学 生物統計学の質問 3 2022/11/11 21:14
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
平均値と中庸値の違い
-
数学Bの「統計的な推測」の【復...
-
エクセル STDEVとSTDEVPの違い
-
信頼区間についての質問です。
-
最大な標本化間隔(ナイキスト間...
-
高校数学の統計 非復元抽出での...
-
平均の加法性とは
-
統計学の中心極限定理(nが十分...
-
標準平均Xバーの標準偏差について
-
母標準偏差・標本標準偏差と標...
-
標本分散の求め方について
-
Rのrnorm関数について
-
母分散と標本分散の違い
-
「有意差」について
-
統計などで出てくる「n」は何...
-
点推定について
-
ヒトの可聴周波数は20Hz~20kHz...
-
母数の意味
-
統計用語(帰無仮説、有意水準...
-
t検定 結果の解釈の仕方
おすすめ情報