不偏分散の (n-1)で割る理由、、、

Question

分散の計算では、nで割る母分散と、(n-1)で割る不偏分散がありますが
なぜ(n-1)で割るのか、いまいち直感に訴える説明に出会っていません。
たいていの本では、天下り式に「(n-1)で割る」とだけしか書いて
いません。たまに親切な本では計算式に平均値が入っているので自由度は
nから1だけ少なくなる云々とありますが、自由度が何故1減らなければ
ならないのか、いまいち理解出来ません。
もう少し高度な本になると、期待値Eやら分散Vやらが出て来て、
不偏統計量云々の「ややこしい」説明が出て来ますが、これも直感に
訴えかける説明ではありません。
数物系出身ながらお恥ずかしい質問ですが、いざ自分に問いかけてみると
納得できる説明が出来ません。「なるほど！」というご説明をいただけると
幸いです。よろしくお願いします。

noname#21649 · Accepted Answer

>自由度とは何を意味するのでしょうか？
数学的正確さがない表現です。

測定点がｎ個あったとします。これをベクトルで考えると．これから求めようとする値である１点の点はｎ個の方向へ引っ張られているのです。この数が自由度です。
もし．このｎ個の中の数の１つを使ってしまったらばどうなるのでしょうか。一つ引っ張る方向が減ります。
世の中にｎこしか測定点が存在しない場合には．全体が決まっていますから平均値を求めても自由度は変化しません。しかし．無数の測定が出来る時に平均を求めたらばどうなるのでしょうか。本来無数の点すべてを測定した時に求められる１点の値が分からないから．ｎ個の測定値の算術平均を取って多分全体の点の１点になるであろうと推定して平均としました。つまり．絶対的な値ではなくて想像上の点です。今まであった点に変えてこの点を使いますから．引っ張る方向が一つ減ります。
自由度で割るというのは．このように引っ張る点１点あたりの割合を示しています。

このように．一つの値を求めようとした時に．自由度は測定点の数から推定点の数を引いた残りを示しています。

motsuan · Answer

私も統計的自由度というのがいまいちわかりませんが計算だけなら確率変数Xの確率分布P(X)があるとします。このとき標本 Xi (i=1～n) で平均ｍ＝ ΣXi/n として <Σ(Xi-m)^2>を計算します。 P(X1)P(X2)・・・P(Xn) が{Xi (i=1～n)}の確率で ∫dX1 P(X1) ∫dX2 P(X2)・・・∫dXn P(Xn) Σ(Xi-m)^2　．．．(※) を展開して母集団の分散 ∫dX P(X)(X-)^2 との関係を導くと(※)をn-1で割ればいいことがわかります。この計算においては、∫dX P(X)(X-)^2という１体問題と (※)というｎ体問題の関係を求めているわけですがこのときn-1は結局、ｎ体問題の関係を１体問題にするときに XiXj(i,j=1～n) のなかから相関のない２つのパラメータの関係（XiXj) (i=jでない) （すなわち本質的な１体問題と）相関のある自分自身（Xi^2)との関係を分離することによって出てくるものです。すなわち、サンプル平均とサンプルの値 Xi (i=1～n) を通して相関がある値が発生するために自由度が減少しているという計算になっているように見えます。（力学でいえば、統計的に等質量の質点のサンプルから　重心と慣性モーメントを求めたときに、　本当の重心の位置とサンプルの重心の違いがあるために、　サンプルの慣性モーメントが小さく見えてしまう　（ので、１個あたり揺らぎの大きさn^(-1/2)ずつ加算して　n個で丁度和の自乗が1になる揺らぎを含んでいるので　その分１だけ小さい値で割る）　ということに対応しているのでしょうか？）

noname#21649 · Answer

正確さが欠けるのですが．以下の説明ではどうでしょうか。

分散の計算では．自由度で割るということが原則です。
ですから．
全数サンプリングの場合には．ｎで割る。平均値は推定値ではありませんから。
部分サンプリングでは．推定値として１つ「平均値」を使ってしまいましたから．ｎ－１で割る。
重み補正をした場合には．重みに使用した自由度（普通１個）と推定値の「平均値」の合計２個の値を使ってしまいましたから．ｎ－２で割る。
欠点補正をした場合には．１点の補正につき１点の自由度が減少します。２点の欠点がある場合に．２点の補正値を推定して．推定値の平均を１つ．合計３つの値を使ってしまいましたから．ｎ－３で割る。
と考えて行きます。その分散を求めるためにいくつの推定値を使ったか.使った分を除くという考え方に立ちます。

不偏分散の (n-1)で割る理由、、、

>自由度とは何を意味するのでしょうか？

私も統計的自由度というのがいまいちわかりませんが計算だけなら

正確さが欠けるのですが．以下の説明ではどうでしょうか。

この回答への補足

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング