dポイントプレゼントキャンペーン実施中!

二項分布やポアソン分布へのχ^2適合度検定のときに自由度がk-1の時とk-2の時があり、理由として

二項分布に関するχ^2適合度検定のとき
・母比率pが既知ならば自由度k-1
・母比率pが未知ならば標本比率を代用し、自由度k-1-1=k-2

ポアソン分布に関するχ^2適合度検定のとき
・平均λが既知ならば自由度k-1
・平均λが未知ならば標本平均を代用し、自由度k-1-1=k-2

というところまで調べたのですが、母数が標本から1つ推定されると自由度を1引くのは何故でしょうか。
また、引く際に自由度が0にならないような注意事項が何かあるのでしょうか。
教えてください。宜しくお願いします。

A 回答 (2件)

>自由度がk-1の時とk-2の時



 二項分布もポアソン分布も、ある事象が「n回試行したときにk回発生する」確率分布という意味での「k」ですよね?
つまり、「k」は k=0 ~ n の「n+1」通りあるということ。

 つまり、ご質問に書かれている内容は、「n回の試行」(サンプル数が n)という条件下で、
・母集団の特性が既知ならば自由度 n
・母集団の特性が未知ならば自由度 n-1
ということではありませんか?
 kの定義と、サンプル数なり試行回数なりの「n」の関係を再確認して、「自由度」の数がいくつなのかをよく見直してみてください。


>母数が標本から1つ推定されると自由度を1引くのは何故でしょうか。

 「母数」とは「母集団の個数(個体数、データ数など)」ですから、ちょっと意味が不明です。
 ここでは「母集団の特性が未知だと1引いた自由度にするのは何故でしょうか」という質問と仮定します。

 統計を「ほんのちょこっと」でも勉強すれば、「不偏分散」というものが出てきますよね?

 通常の「分散」が、母平均を μ として
  σ² = Σ(xi - μ)^2 /n
であるのに対して、「不偏分散」は、標本平均を xbar として
  (σ')² = Σ(xi - xbar)^2 /(n - 1)
というものです。

 母比率 p なり平均 λ が既知ということは、上でいう「母平均 μ が既知」ということです。通常はこれが未知なので本来の「分散」は計算できず、代わりに「標本平均」を使った「不偏分散」を使います。
 たとえば「出口調査対象の1000人の回答から、候補者の得票率の範囲を推定する」のような、「有権者全体の平均・分散は未知なので、出口調査対象1000人の回答の平均・分散を使う」ような場面で使うものです。

 この「不偏分散」が、何故「n」ではなく「n-1」で割るの? というのが、ご質問への回答になります。
 なぜ「n-1」で割るのかについては、厳密には結構厄介なので、くどくど説明するよりも下記などを参照ください。
http://mathtrain.jp/huhenbunsan
http://tech.naviplus.co.jp/2014/02/27/%E4%B8%8D% …

 まあ、直観的な理解としては、「標本平均 xbar は、正真正銘の母平均 μ に対して「母分散」の分だけばらつくから」ということです。
 上の「得票率」の例では、出口調査が1万人ならかなり正確に予想できそうですが、100人だと精度が悪そう、10人では信用できない、ということから分かるように、「サンプル数が多いほどバラツキが小さい」ということです。「不偏分散」においては、「標本平均 xbar のバラツキ」の寄与が、「サンプル数が1個分少ない」ことによるバラツキの増加と等価になるということです。(数学的に厳密には、上記のサイトを見てね)

>また、引く際に自由度が0にならないような注意事項が何かあるのでしょうか。

 上に書いたように、母集団の特性が既知の場合には、自由度がゼロになることはあり得ません。サンプルが1つ(試行が1回)であっても、母平均に対して「大きいか小さいか」の「分布度合い」が分かります。
 母集団の特性が未知で、サンプルが1つ(試行が1回)の場合には、標本平均=標本値そのものなので、「分布」に関して何らの情報も得られません。ですから「自由度ゼロ」で「何も言えない」のです。

 「自由度が0にならないような注意事項」などはありません。上記のように「自由度ゼロ」なら「分布が存在しない」ということです。「自由度」とは「分布のしかた」のパラメータのひとつですから。
 「カイ二乗値」の定義と、その意味するところを復習してみてください。
    • good
    • 1

おぼろげな記憶だと


標本として k個のデータがあってもその「k個のデータ」を完全に自由に選べるわけではなく, 「推定した母数」を変化させないように標本となるデータを選ばなければならないので, その分だけ自由度が減る
という説明を見たような.

ついでに言うと, 自由度が 0 になってしまうようだとそもそも検定が不可能 (あるいは無意味) な気がする.
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!