プロが教える店舗&オフィスのセキュリティ対策術

5つの値のばらつきを求めたいと思います。
母集団推定ではありません。

http://home.a02.itscom.net/coffee/tako08Annex2.h …
このページの下段に「自由度とは」と説明される中に
「標準偏差を計算するときに、平方和Sを計算します。ここでこの意味を考えてみましょう。」
とあります。

平方和が登場することで、そこには測定値の合計が含まれるから、合計がある以上n-1個の測定値で残りの1測定値が一通りに定まるため自由度が1下がる。と読み取りました。

しかし全数調査の場合にも標準偏差を求めようとして、過程で平方和が登場するならば、そこに合計値も含まれる以上、やはり自由度が1下がるということになるのでしょうか。つまりn-1で割ることになるのでしょうか。

全数調査の場合にはnで割ると教わった覚えがあるので混乱しています。


逆に言えば、全数調査の場合にも数式に合計値の意味が含まれるのに、なぜ自由度が1下がらずにnで割るのでしょうか。

質問者からの補足コメント

  • お答えくださりありがとうございます。

    >全数調べれば、標本平均=母平均になりますから、「母平均」を推定する必要がなくなります
    ということは、推定とか代用ではなく標本平均をそのまま用いればよい
    >「自由度」が一つ減るのは、「標本平均」を決めるのに自由度を一つ使うから
    標本平均をそのまま用いればよい、ならば全数調べた場合にも「標本平均」を決めるのに自由度を一つ使う?

    どうもまだ理解していないらしく上の疑問を抱いたのですがお答えいただけるでしょうか。

    No.1の回答に寄せられた補足コメントです。 補足日時:2018/07/17 01:10

A 回答 (2件)

>母集団推定ではありません。



と書いてありますが、そもそも「不偏分散」というものが「母集団の分散の推定」なのですよ。

「サンプルのばらつき具合から」おおもとの「母集団」の「ばらつき具合」(母分散)を推定するものです。
リンク先の説明にも「不偏分散は、標準偏差^2(σ^2)のもっともよい推定値になっている」と書いてあるではありませんか。

数学的に、なぜ「n-1」で割るのかは、あちこちのサイトに説明が載っていると思います。
(不偏分散 u^2 の期待値が E[u^2] = σ^2 になることを示せばよいだけです)

まあ、n 個のサンプルから「分散」を計算するには、本来は「母平均」が必要なのですが、これを「標本平均」で代用するので不確実さが少し増える、それが「n/(n - 1)」ということで「何となく」納得するのも一つの手です。
「自由度」が一つ減るのは、「標本平均」を決めるのに自由度を一つ使うから、という感じで。

>逆に言えば、全数調査の場合にも数式に合計値の意味が含まれるのに、なぜ自由度が1下がらずにnで割るのでしょうか。

全数調べれば、標本平均=母平均になりますから、「母平均」を推定する必要がなくなります。
この回答への補足あり
    • good
    • 0
この回答へのお礼

どうもありがとうございます。

>全数調べれば、標本平均=母平均になりますから、「母平均」を推定する必要がなくなります。

母平均を推定せず不偏分散が登場しなくとも、つまり全数調査の場合のデータのばらつきを算出したい場合にも、標本平均=母平均を算出する時点でリンク先の言う

 x1 ~ xn まであって合計値 T を算出すると、 xi = T - x1 - x2- ・・・ という式に変換できますね。この合計の算出式がひとつ計算の中に入ることで、(n-1)個の観測データがあれば他のひとつの観測データは正確に値が決められる状態になります。

という部分に従って自由度が1減ってしまう気がしてなりません。
まあきっと気のせいなのでしょう。

お礼日時:2018/08/12 12:18

そうだね

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!