中心極限定理についていろいろ調べたんですが、よくわからないことがあります。
(ほとんどの)任意の母集団(平均μ、分散σ^2)からn個の確率変数x1, x2, x3 .... xn を無作為抽出すると、平均値X を求めると、その平均値の分布は、nが大きくなると正規分布(平均μ、分散σ^2 / nの平方根)に近づく
と書いています。
ある母集団分布をおいて、n = 6 として、
サンプル1: x1, x2, x3, x4, x5, x6 を抽出し、平均値 X1 を求める
サンプル2: また、x1, x2, x3, x5, x6 を抽出し、平均値 X2 を求める
サンプル3: また、x1, x2, x3, x5, x6 を抽出し、平均値 X3 を求める
と同様に、やっていくのですよね?
で、この「1回に抽出するデータがn」(上記では n = 6)であり、この nが大きくなると正規分布に近づくということなんですが、
サンプル数(平均値Xの数)はいくつを想定しているのでしょうか?
サンプルが無限だったら、n = 2 だろうが、n = 100 だろうが正規分布のような気がするのですが。
いろいろなサイトで、
n = 1 や、n = 2 のケースでやったときの分布図が掲載されているのですが、これはサンプル自体の数が多いのでしょうか?
n の意味と、サンプルの数(平均値Xの数) が混乱しているようです。
教えてください。
No.2ベストアンサー
- 回答日時:
質問文に「任意の母集団から」とか「抽出する」とか出てくることが
気になっていたのですが、「この行為を複数やって分布つくる」も
その流れですね。まず、そこの考え方が違うんだと思います。
母分布から x1,x2,…,xn を独立に取って X = (x1+x2+…+xn)/n とする
と決めた時点で、確率変数 X は定義され、X の分布は決まっています。
X のサンプルをいくつか取り出してヒストグラムを書くのは、
その分布をイメージしやすくするための単なる略図であって、
サンプルを抽出することで「分布をつくる」訳ではありません。
このあたり、確率モデルと記述統計がゴッチャになっているようです。
それが混乱の大元かもしれません。
それから、細かいことですが、その参照サイトで「サンプリング数」と
呼んでいるものは、この質問で n と呼んでいるもののことであり、
貴方が「サンプル数」と呼んでいる、ヒストグラムを書くために抽出した
X のデータの個数とは、異なります。ややこしいですね。
X の分布のヒストグラムを書くとき、データをそのままヒストグラムに
しており、データを足したり、データ数で割っていないことにも注目
してください。ヒストグラムの全データを足して、データ数で割ったら
どうなりますか? ヒストグラムで近似した分布の平均値になりますね。
それがどこにあるか が、データ数→∞ とすると、X の平均を平均とした
正規分布に従う というのが、中心極限定理の結果なのです。
御礼遅くなりました。
初学者向けの統計学の書籍をいろいろとあたってみました。
微妙にいろいろと説明の仕方が違うんですね。
説明として
x1, x2, ・・・・xn という n個のデータを取って、平均をとる、これを k回行う
という流れで、n を多くとってみる、というやり方と、k を多くとってみる、というやり方で、どちらも、同じような結果になる、といった説明もありました。
もっと勉強して、その意味するところを自分なりに理解したいと思っています。
きっちりとしたテキストを立ち読み (フェラー、伊藤清など)をしてみたら、そちらの方がよく理解できそうに思えたので、勉強してみます。
No.1
- 回答日時:
中心極限定理を正確に書くと、
分散が有限なひとつの確率分布に独立に従う n 個の確率変数 x1,x2,…,xn があるとする。
その平均 X = (x1+x2+…+xn)/n の確率分布は、n→∞ のとき、正規分布へ分布収束する。
ということです。
確率変数 X の値を何個か取り出すという話は、中心極限定理とは関係ないですよ。
この回答への補足
回答ありがとうございます。
記述いただいた
「その平均 X = (x1+x2+…+xn)/n の確率分布は、n→∞ のとき、正規分布へ分布収束する。」
というのを実際に体感してみたくてエクセルなどでいじっているのですが、その際に、以下のサイトをみつけました。
http://anchoret.seesaa.net/article/65176557.html
このサイトでは、「サンプル数が1の場合」「サンプル数が2の場合」という具合にやって、その際の平均の分布をヒストグラムにしているのですが、例えばサンプル数が2というのは、元の母集団から無作為に2つの値を取り出しているというのはわかるのですが、じゃあこのヒストグラムはそういった行為を何回やってできたんだろうかと。
大数の法則と中心極限定理の理解が混乱しているのか・・・
「その平均 X = (x1+x2+…+xn)/n の確率分布は、n→∞ のとき、正規分布へ分布収束する」
の「分布」を n = 5 のとき、n = 100 ときといったようにそれぞれつくって体感してみたいのですが、例えば、n = 5 としたら、元の母集団分布から無作為に5つの値を取り出して、平均を計算するんですよね?
「平均」の「確率分布」なので、この行為を複数やって分布つくるんだと理解しているのですが、この時、そういった行為は何回やるのだろうかと?
無限にやったら、n = 5 でも正規分布に近くなると思うと、n = 100 のときと違わないだろう、だったら n -> ∞ で正規分布に分布収束する、という意味がよくわからない、という具合なんです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- 数学 数学の問題です。 問1: ある(人数の非常に多い)集団から無作為に6名を選んで身長を測ったところ、そ 2 2022/12/09 12:03
- 統計学 ある集団の平均身長を調べたい. 集団全体を母集団とし, 母集団から無作為抽出した15人の平均身長が1 1 2023/02/03 15:26
- 数学 数学の答えと解き方を教えてください。 問:ある(人数の非常に多い)集団から無作為に6名を選んで身長を 4 2022/12/14 10:06
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 統計学 最大値の標準偏差 15 2023/02/02 18:36
- 数学 以下の数学の問題を教えてください。 確率変数Xは標準正規分布N(0、1)に確率変数Yは平均3のポアソ 3 2022/12/02 19:13
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
3σについて
-
信頼区間 正規分布しない場合
-
X1,X2,X3は母平均μ、母分散σ^2>...
-
信頼度から必要な試行回数を求...
-
3σの考え方
-
成績順位の推定
-
二項分布と正規分布の違い?
-
平均値、標準偏差、幾何平均、...
-
トコジラミ
-
統計学の問題なんですが・・・
-
朝起きてスマホの時計をみると4...
-
10本のくじの中に当たりくじが2...
-
確率?組合せ?について教えて...
-
4つのサイコロを同時に振って...
-
重複順列
-
一般常識を教えてください。1割...
-
3つのサイコロを振って出た目の...
-
数学の問題で4C0の答えを教えて...
-
サイコロ3個を振った時の確立...
-
a.b.c.d.eの5個から3個を選んで...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報