dポイントプレゼントキャンペーン実施中!

好奇心から統計の入門書を読んでの疑問です。

標本分散(sample variance)=偏差平方和(SS)/標本サイズ(n)

は理解できたのですが、
この分母を (n-1) にして、

不偏標本分散(unbiased sample variance)=SS/(n-1)

というものをわざわざ考えるのはなぜですか?
標本分散だけで充分役に立つと思うのですが…。
分母を n でなく (n-1) とする意義は何でしょうか?
「突出した標本を未然に除外する」ということなんでしょうか?

オリンピック体操種目の採点の際、不公正を排すために最高点・最低点を除外して計算するというのを聞いたことがありますが、それと同じ目的でしょうか?
だとすれば、なぜ (n-2)や(n-3)ではなく、あえて (n-1) なのでしょうか?

よろしくお願いいたします。

A 回答 (1件)

この原因は実際の標本サンプルデータが正規分布とは異なり、平均値mがX(bar)と異なることにあります。


基本的に推定量とは確率変数ですから標本により変動するわけです。
実際(X(i)-X(bar))^2を計算してみると分りますが、(X(i)-m)^2とは異なり、σ^2にはなりません。
具体的には((X(i)-m)-(X(bar)-m))^2を計算すれば分ります。
とりあえず自分で確かめることをお勧めします。
分らなければ再度ご質問ください。
    • good
    • 0
この回答へのお礼

ありがとうございました。
別の本を読んで、やっと理解できました。

お礼日時:2002/10/10 11:44

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!