アプリ版:「スタンプのみでお礼する」機能のリリースについて

1~10000までの値をランダム(一様分布)に10000000回抽選して
それぞれの値が出た回数をデータAとします。

A[1~10000]={
991 // 1が出た回数
986 // 2が出た回数
1002 // 3が出た回数
・・・
}

この出た回数をカウントしたものをデータBとします。
B[0~?]={
0 // データAの0の数
1 // データAの1の数
・・・
154 // データAの985の数
151 // データAの986の数
・・・
199 // データAの1000の数
187 // データAの1001の数
・・・
}

このデータBは正規分布に従うと思うのですが、この場合の理論標準偏差を教えてください。

要するに1~Nの範囲でM回一様分布に従って抽選した結果の各値の出る回数の分布の標準偏差を求めた場合、どれくらいになっていればその抽選が真にランダムな一様分布に近いといえるかを検証したいんです。

宜しくお願いします。

A 回答 (1件)

厳密には正規分布にはならないと思いますが、


件数が大きい極限では正規分布と見做して取り扱います。

通常は分布の検定ではχ2乗検定を行ないます。
 χ2=Σ(fi-npi)^2/npi
 ここで fiは観測度数、npiが期待度数です。
が自由度k-1のχ2乗分布に従うという言い方をします。

χ2乗分布に従うということはその変数(fi-npi)/√npiが
平均0、標準偏差1の正規分布に従うということですので、
その意味では期待度数と観測度数の差を√期待度数で割った
ものが正規分布に従うということになります。

なので、標準偏差としては√期待度数となります。
この場合ですと、npは1000なので~31.6ということになります。

ただ、この値がどの範囲なら許容されるかを決める問題は
残されています。なので、通常は前述のχ2乗検定を行ないます。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!