アプリ版:「スタンプのみでお礼する」機能のリリースについて

X1,X2,...Xnが連続独立同一分布のランダム変数の時、中央値や平均値ってどういう分布を取るのでしょうか?
独立同一分布からよく分かっていないので初歩にも分かるように説明していただきたいです。

A 回答 (1件)

1 まず、言葉の意味をはっきりさせます。



(分布、分布関数)
「分布」自体の定義は面倒なので、代わりに「分布関数」を定義します。Xを確率変数として、tを実数とします。「Xがt以下になる確率」を「Xの分布関数」といいます。分布の性質は、分布関数によって完全に特徴付けられます。この意味で、分布を知ることと分布関数を知ることとは、同義です。なお、分布関数は、0から1までの値をとる広義単調増加関数(s<tならF(s)≦F(t))です。

(連続、独立、同一)
 Xの分布関数をF(t)とします。Xの分布が「連続」であるとは、F(t)が連続関数であることを意味します。
 確率変数X1,…,Xnの分布関数をF1(t),…,Fn(t)とします。X1,…,Xnが「独立」であるとは、任意の実数t1,…,tnに対して「X1≦t1、…、Xn≦tnとなる確率」がF1(t)×…×Fn(t)となることを意味します。
 X1,…,Xnの分布が「同一」であるとは、F1(t)=…=Fn(t)であることを意味します。

(分布平均、観測平均)
 「平均」という言葉には、いくつかの意味があります。ここでは、混乱を避けるため、次のように使い分けることにします。
 「分布平均」 確率変数Xの期待値
 「観測平均」 確率変数X1,…,Xnの単純平均((X1+…+Xn)/n)。

(分布中央値、観測中央値)
 同様に、「中央値」についても次のように使い分けることにします。
 「分布中央値」 F(t)=1/2 となるt
 「観測中央値」 X1,…,Xnのうち小さい方から(n+1)/2番目の値(nが奇数のとき)、又はn/2番目の値とn/2+1番目の値の単純平均(nが偶数のとき)

2 観測平均の分布

 ご質問の意味は、観測平均や観測中央値の分布がどうなるか、ということと解します。観測平均や観測中央値は、それ自体が確率変数なので、その分布を考えることができるのです。以下、X1,…,Xnは、独立で同一の分布に従う確率変数とします(「連続」の仮定は不必要)。

 観測平均の分布は、「X1/n の分布をn個畳込んだもの」となります。「」内の意味が難しいかもしれませんが、雰囲気として、一般的手法が確立していることが理解できると思います。

 とくに、X1が分布平均μ、分散σ^2の正規分布に従うとき、観測平均は、分布平均μ、分散(σ^2)/nの正規分布に従います。

 また、X1が正規分布に従わなかったとしても、緩い条件が満たされたなら、nが大きいとき、観測平均は、分布平均μ、分散(σ^2)/nの正規分布に近似的に従うことが知られています(中心極限定理)。

3 観測中央値の分布

「X1,…,Xnのうち小さい方からk番目の値」の分布関数をG(t,k,n)とします。G(t,k,n)は、具体的に

  G(t,k,n)=Sum(Comb(n,r)・F(t)^r・(1-F(t))^(n-r)| r=k,…,n)

となります。Comb(n,r)は、n個からr個を選ぶ組み合わせの個数で、F(t)は、X1の分布関数で、Sum(| r=k,…,n)は、rがkからnに至るまでの総和を表します。

 観測中央値の分布関数は、nが奇数のとき、

  G(t,(n+1)/2,n)

となります。nが偶数のときは、面倒なので省略します。ただ、nが大きいときは、奇数のときの式を使っても大差ありません。

 もし、X1の分布中央値が確定するなら、これをaとして、次が成立します。

  (1) 観測中央値の分布中央値は、aに一致する。

  (2) εを正数とする。観測中央値がa-ε以下又はa+ε以上になる確率は、nが大きくな
    るとき、0に収束する。すなわち、観測中央値は、nが大きくなるに従い、aの近辺
    に集まるようになる。

 なお、X1の分布中央値は、いつも確定すると限りません(例えば、F(t)のグラフがF(t)=1/2となるtを含む区間で水平になるときは、分布中央値が確定しない)。

(参考)伊藤清(1953),"確率論",岩波書店
    • good
    • 0
この回答へのお礼

ご丁寧にありがとうございます。

お礼日時:2010/10/25 04:10

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!