
どうしても分からないので、教えていただけると助かります。
正規分布N(μ、σ2)に従う母集団から無作為抽出した標本(X1、X2、・・・、Xn)について、
Σ{(Xi-Xm)/σ}2 (iは1~n、XmはX1~Xnの平均)
が自由度n-1のX2乗分布に従うという話の説明で、
(X1-Xm)/σ+(X2-Xm)/σ+(X3-Xm)/σ+・・・+(Xn-Xm)/σ=0
が成り立つため、(Xi-Xm)/σは自由度が一つ減る、といったものを見かけます。
ただ、この式自体、変形すると、X1+X2+・・・+Xn=n×Xmという自明のものであり、X1からX(n-1)までの値によってXnの値が規制されるわけでもないので、なぜ自由度が減るのか理解できません。
Xnのとる値によってXmも自動的に求まり、X1+X2+・・・+Xn=n×Xmは当然成立しますので、Xnのとる値が制限される(自由度が減る)わけではないと思うのですが・・・
No.4ベストアンサー
- 回答日時:
自由度の定義は
https://best-biostatistics.com/contingency/degre …
をご覧下さい。
n個のデータがあった時、平均値が与えられた元で自由にデータを決める事が出来る数はn-1個である
と言うのが、t検定における自由度の定義と解説されています。
nを非常に大きく取る場合分布は正規分布に近ずくので、平均値は与えられている、と考えていいのではないですか。
なるほど!本来はXnが決まって初めて平均値(Xn)が決まるものなのに、平均値があらかじめ与えられたうえでXnを決めるのでn-1という理解ですね。
とても参考になるサイトを教えていただき、ありがとうございます。感謝です!
No.3
- 回答日時:
>(X1-Xm)/σ+(X2-Xm)/σ+(X3-Xm)/σ+・・・+(Xn-Xm)/σ=0 ①
であれば、例えば
(Xn - Xm)/σ = -[ (X1 - Xm)/σ + (X2 - Xm)/σ + (X3 - Xm)/σ + ・・・ + (X(n-1) - Xm)/σ ]
なので、X1 ~ X(n-1) の (n-1)個のデータが決まれば Xn は自動的に値が決まってしまうので、実際に自由に値が変化できるパラメータは「(n-1) 個しかない」ことになります。つまり [X1, X2, X3, ・・・, Xn] のデータの分布といっても、実際には [X1, X2, X3, ・・・, X(n-1)] のデータでその分布が決まってしまいます。
つまり、n 個のパラメータのうち、実際に自由に変化できるのは (n-1) 個ということになります。それが「自由度」です。
それを説明するために①式を持ち出しているのでしょう。
でも、それが何で「カイ二乗分布の自由度なの?」というのが質問者さんの疑問でしょうか?
>Xnのとる値によってXmも自動的に求まり
とありますが、それが問題なのです。
本当に計算したいのは、母集団の平均 μ との偏差なのですが、母平均 μ は通常「未知数」です。なので 「母平均 μ の代わりに、標本平均 Xm で代用する」のです。
しかも、①の計算に使っている σ (母集団の標準偏差)だって、本当は「未知数」なのです。従って「母分散 σ^2 が未知数なので、標本分散 s^2 で代用する」みたいなことをしないといけません。標本分散は、標本平均 Xm を使って計算されますね。
標本データの分散を計算するには「2乗偏差和」をデータ数 n で割ればよいのですが、「不偏分散」という「2乗偏差和」をデータ数 (n-1) で割ったものがあったことを思い出してください。この「標本のばらつき方から、母集団のばらつきを推定する」というときに「不偏分散」や「n-1」が出てきます。
カイ2乗分布の「自由度:n-1」もこれに類したものと考えればよいのではないかと思います。
カイ2乗分布自体が「ばらつき方の分布」なので、そういった考え方が入り込んできます。
No.2
- 回答日時:
をご覧下さい。
X1+X2+・・・+Xn=n×Xmで、X1+X2+・・・+X(n-1)まで決まると
Xnは自動的に決まるので、自由度はnより1少なくなってn-1と解説されています。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
極値をもつ時と持たない時、単...
-
ノンパラメトリック検定の多重...
-
4sin²θ-1>0 (0°≦θ≦360°のとき) ...
-
高校 数学 aを実数の定数とする...
-
どの統計を使えばいいのか教え...
-
少ない母数に対するアンケート...
-
基本的なことで恐縮ですが、回...
-
x=2分の3のグラフはどのように...
-
統計学の問題でわからないので...
-
パイロットサンプルって何ですか?
-
ナイキスト周波数の単位について
-
中学理科の問題です。解き方を...
-
欠損値を分析ごとに排除するこ...
-
エクセルの統計でχ二乗検定の結...
-
非線形データ(2次関数)の相関...
-
EXCELにてローパスフィルタを作...
-
最小二乗法を反比例の式を元に...
-
線形なグラフとはひとくちに言...
-
エクセルのグラフから半値幅を...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
極値をもつ時と持たない時、単...
-
エクセルのグラフから半値幅を...
-
検量線の決定係数について
-
統計について
-
【統計】有意に「高い」?「低...
-
最小二乗法を反比例の式を元に...
-
下の対数表示のグラフから低域...
-
統計学の問題でわからないので...
-
変化率のみで、有意差の検定は...
-
線形なグラフとはひとくちに言...
-
パイロットサンプルって何ですか?
-
アンケートの集計分析の基礎(...
-
検定統計量の値がマイナス
-
一元配置分散分析のp値が0になる
-
理科のグラフで、直線と曲線の...
-
心理機能診断をしたのですが、...
-
IGORの使い方
-
対応のあるt検定の結果の書き方
おすすめ情報
回答ありがとうございます。参考 URLも拝見しました。XmはX1からXnまでの平均なので、そもそもXnが定まらないと平均は求まらないので、自動的にXnが求められるというのはやはり理解できません。。