プロが教える店舗&オフィスのセキュリティ対策術

N個の一様乱数(例えば[0,1])の平均はどのような確率分布になりますでしょうか。

また、一様乱数の平均を、適当な処理をして同じ区間で一様にできないものでしょうか。

何卒よろしくお願いいたします。

A 回答 (4件)

「平均」という用語には2通りの使い方があります。



1つ目の使い方は、母集団平均と呼ばれるもので確率変数に対して決まった定数で、母集団平均自体は確率変数ではありません。一つの一様乱数[0,1]の母集団平均は1/2です。

もう一つは、標本平均と呼ばれるもので、これはデータから求める計算するものであるので、データを取る前の段階では確率変数です。質問者の意図されているのはこちらでしょう。

さて、N個の一様乱数の標本平均がどんな分布になるかというと、これは簡単には求められません。簡単に分かる範囲で言えることは:
(1) 平均は1/2
x_1, x_2,...を一様乱数、Yをそれらの標本平均とすると
E(Y) = E[ 1/NΣx_n ] = (1/N)Σ E(x_n) = (1/N)Σ(1/2) = 1/2.
2つ目の等式は期待値の線形性によります。

(2) 分散は(1/N)(1/12)
 Var(Y) = Var [ 1/NΣx_n ] = (1/N)^2 Var[ Σx_n ]
= (1/N)^2 ΣVar[ x_n ] = (1/N)^2 Σ(1/12) = (1/N)(1/12)
 3つ目の等式は独立性によります。つまり、分散はNが大きくなるにつれて小さくなります。

(3) N→∞ のとき、Yは定数(1/2)に(確率)収束する。
大数の法則と呼ばれる結果です。(2)から、分散が0に収束することが分かります。分散が0の確率変数、つまりは定数(実質的には確率変数ではない)ということです。

(4) √N (Y - 1/2)/√(1/12) はN(0,1)、つまり標準正規分布に(分布)収束します。
中心極限定理と呼ばれる結果です。√N をかけると定数には収束せず、どんなにNを大きくしても確率変数に近づきます。

通常は中心極限定理を用いて正規分布で近似するのがよく使う手だと思います。Nが50くらいでも十分近い分布になります。
(5) 正確な分布の求め方
複雑になるのでN=2の場合だけ。方法としては「確率変数の関数」の分布の求め方を使います。
Yが0から1の値しか取らないことは明らかなのでその範囲で考えます。
求めたいYの確率分布関数(cdf)をFとすると、
F(y) = Pr(Y≦y) = Pr(x_1 + x_2 ≦ 2y)
この後重積分を注意深く進めれば答えは出ます。計算はちょっと面倒なので省略しますが、F(y) = Pr(Y≦y)と置いてから積分で求めるのがポイントです。Fはcdfなので、密度を求めるにはyで微分します。

また、N=2の場合だけですが、積分を使わずに図形だけで求めることもできます。座標軸に(0,0)と(1,1)を対角に持つ正方形を描きます。横軸・縦軸をそれぞれx_1, x_2だと思えばこの正方形が取りうるペアの範囲です。一様乱数なので密度は正方形のなかはどこでも1で一定。ある範囲に収まる確率はその範囲の面積が対応します。さて、F(y) = Pr(x_1 + x_2 ≦ 2y)ですので、これに対応する範囲と正方形の共有部分の面積を求めればよいことになります。y≦1/2の時は三角形、y>1/2の時は五角形になるんじゃないでしょうか。
    • good
    • 0
この回答へのお礼

皆様ありがとうございました。

大体納得できました。
ややこしい質問の表現して申し訳ないです。

お礼日時:2009/01/22 22:13

>>>


N個の一様乱数の平均は、同じ区間の一様乱数ということでしょうか。
実際に区間[0,1]の乱数を1000個くらい平均すると極めて0.5に近くなるので、いまいち納得できないのですが。
もしかして私が勘違いしてるか表現悪かったでしょうか。


すみません。
ご質問文を読み間違えていました。


0~a の区間の一様乱数の平均は、
1/a・∫[0→a]x dx = 1/a・x^2/2[x=0→a]
 = 1/(2a)・(a^2 - 0^2)
 = a/2

よって、[0,1]の範囲、すなわち a=1 のときには、
平均は、1/2 (=0.5)になります。


平均の確率分布については、わかりません。

失礼しました。
    • good
    • 1

一様乱数の意味を勘違いなさっているように思われます。


[0,1)の一様乱数でしたら、0~1の間に、ムラなく分布する乱数、ということになります。

なので、No.1さんの回答に対するお礼で、
>実際に区間[0,1]の乱数を1000個くらい平均すると極めて0.5に近くなるので、いまいち納得できないのですが。
とありますが、それは「出た値」を足して平均しているからです。

次の例は離散的ですが、1~6のどれも公平に出るサイコロがあるとします。
これも、グラフが飛びとびになる点を除けば、一様に確率1/6を示します(でなかったら、ある目が出やすい歪なサイコロです)。飛び飛びのグラフが確率密度関数のグラフです。
一方、「これ以下になる確率」を下から見ていけば、1の目のとき1/6、2の目のときは(=1か2のどちらかが出る)2/6となって、6のときは1になります。こちらが分布関数です。
で、出た目の平均をとるのは、このどちらとも関係ありませんよね?
仮にサイコロの目に書いてある数字が1・2・3~6でなくて、100・200・300~600であっても、確率は1/6で同じですが、出る目の平均は当然違いますよね。
たぶん、期待値と分布関数がごっちゃになっているのだと思います。
    • good
    • 0

こんばんは。



>>>N個の一様乱数(例えば[0,1])の平均はどのような確率分布になりますでしょうか。

極めて単純です。
折れ線グラフで言えば、0~1の区間で、横方向1本の直線になりますし、
ヒストグラムで言えば、底辺の長さが1の長方形(正方形)になります。


>>>また、一様乱数の平均を、適当な処理をして同じ区間で一様にできないものでしょうか。

平均をA倍したければ、1個1個の乱数の値を全部A倍にすればよく、
平均をB分の1にしたければ、1個1個の乱数の値を全部B分の1にすればよいだけの話です。


以上、ご参考になりましたら。

この回答への補足

ありがとうございます。

N個の一様乱数の平均は、同じ区間の一様乱数ということでしょうか。
実際に区間[0,1]の乱数を1000個くらい平均すると極めて0.5に近くなるので、いまいち納得できないのですが。
もしかして私が勘違いしてるか表現悪かったでしょうか。

補足日時:2009/01/22 04:36
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!