二項分布やポアソン分布へのχ^2適合度検定のときに自由度がk-1の時とk-2の時があり、理由として
二項分布に関するχ^2適合度検定のとき
・母比率pが既知ならば自由度k-1
・母比率pが未知ならば標本比率を代用し、自由度k-1-1=k-2
ポアソン分布に関するχ^2適合度検定のとき
・平均λが既知ならば自由度k-1
・平均λが未知ならば標本平均を代用し、自由度k-1-1=k-2
というところまで調べたのですが、母数が標本から1つ推定されると自由度を1引くのは何故でしょうか。
また、引く際に自由度が0にならないような注意事項が何かあるのでしょうか。
教えてください。宜しくお願いします。
No.2ベストアンサー
- 回答日時:
>自由度がk-1の時とk-2の時
二項分布もポアソン分布も、ある事象が「n回試行したときにk回発生する」確率分布という意味での「k」ですよね?
つまり、「k」は k=0 ~ n の「n+1」通りあるということ。
つまり、ご質問に書かれている内容は、「n回の試行」(サンプル数が n)という条件下で、
・母集団の特性が既知ならば自由度 n
・母集団の特性が未知ならば自由度 n-1
ということではありませんか?
kの定義と、サンプル数なり試行回数なりの「n」の関係を再確認して、「自由度」の数がいくつなのかをよく見直してみてください。
>母数が標本から1つ推定されると自由度を1引くのは何故でしょうか。
「母数」とは「母集団の個数(個体数、データ数など)」ですから、ちょっと意味が不明です。
ここでは「母集団の特性が未知だと1引いた自由度にするのは何故でしょうか」という質問と仮定します。
統計を「ほんのちょこっと」でも勉強すれば、「不偏分散」というものが出てきますよね?
通常の「分散」が、母平均を μ として
σ² = Σ(xi - μ)^2 /n
であるのに対して、「不偏分散」は、標本平均を xbar として
(σ')² = Σ(xi - xbar)^2 /(n - 1)
というものです。
母比率 p なり平均 λ が既知ということは、上でいう「母平均 μ が既知」ということです。通常はこれが未知なので本来の「分散」は計算できず、代わりに「標本平均」を使った「不偏分散」を使います。
たとえば「出口調査対象の1000人の回答から、候補者の得票率の範囲を推定する」のような、「有権者全体の平均・分散は未知なので、出口調査対象1000人の回答の平均・分散を使う」ような場面で使うものです。
この「不偏分散」が、何故「n」ではなく「n-1」で割るの? というのが、ご質問への回答になります。
なぜ「n-1」で割るのかについては、厳密には結構厄介なので、くどくど説明するよりも下記などを参照ください。
http://mathtrain.jp/huhenbunsan
http://tech.naviplus.co.jp/2014/02/27/%E4%B8%8D% …
まあ、直観的な理解としては、「標本平均 xbar は、正真正銘の母平均 μ に対して「母分散」の分だけばらつくから」ということです。
上の「得票率」の例では、出口調査が1万人ならかなり正確に予想できそうですが、100人だと精度が悪そう、10人では信用できない、ということから分かるように、「サンプル数が多いほどバラツキが小さい」ということです。「不偏分散」においては、「標本平均 xbar のバラツキ」の寄与が、「サンプル数が1個分少ない」ことによるバラツキの増加と等価になるということです。(数学的に厳密には、上記のサイトを見てね)
>また、引く際に自由度が0にならないような注意事項が何かあるのでしょうか。
上に書いたように、母集団の特性が既知の場合には、自由度がゼロになることはあり得ません。サンプルが1つ(試行が1回)であっても、母平均に対して「大きいか小さいか」の「分布度合い」が分かります。
母集団の特性が未知で、サンプルが1つ(試行が1回)の場合には、標本平均=標本値そのものなので、「分布」に関して何らの情報も得られません。ですから「自由度ゼロ」で「何も言えない」のです。
「自由度が0にならないような注意事項」などはありません。上記のように「自由度ゼロ」なら「分布が存在しない」ということです。「自由度」とは「分布のしかた」のパラメータのひとつですから。
「カイ二乗値」の定義と、その意味するところを復習してみてください。
No.1
- 回答日時:
おぼろげな記憶だと
標本として k個のデータがあってもその「k個のデータ」を完全に自由に選べるわけではなく, 「推定した母数」を変化させないように標本となるデータを選ばなければならないので, その分だけ自由度が減る
という説明を見たような.
ついでに言うと, 自由度が 0 になってしまうようだとそもそも検定が不可能 (あるいは無意味) な気がする.
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
統計学における有効数字につい...
-
標本分散と不偏分散の使い分け...
-
サンプル数が1とサンプル数が...
-
工程能力のN数補正について
-
標本分散が母分散より少し小さ...
-
(2)Xの分散の求め方を教えてく...
-
不偏分散の分布は?
-
不偏分散を計算するときに標準...
-
偏差値60の人と偏差値50の人が...
-
正規分布に従わないと標準偏差...
-
今日数学のテストが返ってきて ...
-
標準偏差バーをグラフに入れた...
-
統計でいう「n」は、何の略な...
-
標準偏差
-
社会人の偏差値の調べ方
-
統計学でいうRSD%とは何ですか。
-
高校偏差値67ってどのくらい字...
-
重荷分散の為に敷く板には木製...
-
20代男子で身長162cmって全体の...
-
95%信頼区間でσ / √nのσが1.9...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
統計学における有効数字につい...
-
工程能力のN数補正について
-
サンプル数が1とサンプル数が...
-
標準偏差について
-
標本分散が母分散より少し小さ...
-
3者見積の異常値
-
標本分散と不偏分散
-
一様分布について
-
標本分散と不偏分散の使い分け...
-
標本分散の合併について
-
不偏分散を計算するときに標準...
-
標準偏差を表す記号
-
自由度及び平均平方について(...
-
分散の計算で平方和をnではなく...
-
数学の問題です。 問1: ある(...
-
答えがあわない>< 標本標準...
-
信頼区間が求められない。
-
標本の標準偏差・・なんで分母...
-
不偏分散の (n-1)で割る理由、、、
-
エクセルによる母分散の検定
おすすめ情報