アプリ版:「スタンプのみでお礼する」機能のリリースについて

仕事で解が解けずに悩んでいます。助けてください。
平均値E(1)~E(N) 標準偏差V(1)~V(N)の正規分布の確率分布を持つN群の独立した事象があるとします。各集団のn数は等しく十分に大きいものとします。
このときに各集団から1つづつ任意にサンプルをNコ取り出して、その最大値がどのような確率分布(平均と標準偏差)になるか、一般解を求めたいと考えています。
もっとも単純な例として、等しい分布の集団から2コ取り出す例で
平均:E(1)=E(2)=150 標準偏差;V(1)=V(2)=50とおいてn=5000で実数検証してみると、最大値の分布は E=178 V=40ぐらいになりました。
処理時間ばらつきを持つ工程をNコ連続配置したときにスループットがどのようになるかの推定が目的です。

A 回答 (4件)

>具体的にn=2のとき e1 e2は どのような式(値)に


>なるのでしょうか。稚拙な質問で恐縮です。

n=2ぐらいなら厳密に計算できるかな、と思ってやってみました。
n=2のときの確率密度関数は、
f(x) = e^(-x^2/2)*(1+erf(x/√2))/√(2π)
なんで、
平均 = ∫xf(x)dx = 1/√π = 0.56418958354775628695…
分散 = ∫x^2f(x)dx - (∫xf(x)dx)^2 = 1-1/π = 0.68169011381620932846…
となるようです。
    • good
    • 0
この回答へのお礼

感激です。ありがとうございます。
私の質問での言葉の定義が不正確で申し訳なかったのですが
Eは平均で Vは標準偏差(=分散^1/2)のつもりでした。
E=150 V=50の正規分布は±3σで0~300まで大きくばらつきがあるものを想定していました。
したがって
E=150+0.564*50=178 V^2=0.6817・50^2 V=41
これで完璧に合うのではと思われます。
一方、私の式は、標準正規分布でG(x)=0.5のときにxが(中央値=平均)とみなして値を出そうとしてました。
e1はGinv(0.5^(1/2))=0.545で近い値ですが、
e2の出し方は私の先の考え方が間違っていて、
 Ginv[{Ginv(1)}^1/2]-Ginv(0.5^(1/2))=0.8418
で教えていただいた数字0.682に対して0.8418^2=0.707とまあ使える数字でした。
いずれにせよ、きちんと工学的に解法が見出せてきた感があり、とても感謝しています。  

お礼日時:2007/07/09 09:06

単純に1次近似で近似式を求めてみると、


β分布B(n,1)は、
平均が、n/(n+1)
標準偏差が、 √(n/{(n+2)(n+1)^2})
ですから、
正規分布の累積分布関数の逆関数をGinv(x)と書いたときに、
標準正規分布に独立に従うn個の確率変数の最大値は、
平均が、 Ginv(n/(n+1))
標準偏差が Ginv'(n/(n+1))*√(n/{(n+2)(n+1)^2})
と近似できそうです。

平均μ=150,分散σ^2=50の正規分布で、n=5000として実際に計算してみると、
平均 ≒ 175.03254578514972967
標準偏差 ≒ 1.8657075963054361591
となりました。平均は数値実験(E=178 V=40)とあってるようですが、標準偏差のほうがかなりずれてますね。
数値実験の分散=40ていうのは直感的にはちょっと大きすぎるような気もするのですが、もし本当だとすると、1次近似では無理があるってことですかね。
    • good
    • 0

#1で書いたことと本質的には全く同じですが。



区間[0,1]の一様分布に従う独立なn個の確率変数の最大値の分布は、β分布 B(n,1) に従います。
http://en.wikipedia.org/wiki/Beta_distribution
http://www.kwansei.ac.jp/hs/z90010/sugakuc/touke …

ところで、正規分布の累積分布関数の逆関数をG(x)とすると、[0,1]一様分布に従う確率変数Xがあるとき、定義からG(X)は正規分布に従うことになります。(別に正規分布だけではなくて任意の分布について言えることですが)

ということで、β分布B(n,1)に従う確率変数をYとしたとき、
G(Y)は、正規分布に従う独立なn個の確率変数の最大値の分布になりますね。
これから、計算するほうが多分楽でしょう。

この回答への補足

下記の追加質問について自分で解けました。
標準正規分布関数を用いて さらに単純化して考えるとわかりました。
累積分布関数の逆関数をGinv(x)とすると
平均はGinv(0.5^(1/2))=0.54495 標準偏差は平均の二乗で0.7511
実数検証結果と一致していると思われ、だいぶ理解が深まりました。
ありがとうございます。

補足日時:2007/07/07 20:08
    • good
    • 0
この回答へのお礼

rabbit_cat様
早々にありがとうございます。すばらしいアドバイスで一気に解に近づけました。β分布の活用までは行き着けていたのですが、まだまだ理解不足で断念していました。もう少しきちんと勉強してみます。
ところで ANo1の2つめURLで紹介いただいた解説から、
平均=μ 標準偏差σ の正規分布 nコの最大値の分布で
E=μ+e1・σ V=e2・σ^2 でe1 e2はそれぞれnについての増加、減少関数と表現できることはピンとくるのですが、
単純例として 具体的にn=2のとき e1 e2は どのような式(値)に
なるのでしょうか。稚拙な質問で恐縮です。

お礼日時:2007/07/07 13:43

一般に累積分布関数がF(x)で表せる、独立なn個の確率変数の最大値の累積分布関数は


(x)={F(x)}^n
となります。
これから、一応、平均、分散を計算することが可能です。

http://ja.wikipedia.org/wiki/%E9%A0%86%E5%BA%8F% …
http://www.geocities.jp/ikuro_kotaro/koramu/278_ …
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


このQ&Aを見た人がよく見るQ&A