性格いい人が優勝

X1,…Xn}は無作為標本で、周辺密度関数が以下で与えられている。
f(x)=1/c 0<=x<=c
0 それ以外
cは正の整数

(1) max{X1,…Xn}の期待値はnが大きくになるにつれてcに収束する事を示せ。

(2) n=5とする。帰無仮説H0 c=1を対立仮説H1 c>1に対して検定したい。そのため、Y5>dのとき、帰無仮説を棄却することにする。有意水準が0.1のときdの値を求めなさい。

上記の問題についてご教授頂きたいです。
何卒宜しくお願い致します。

質問者からの補足コメント

  • kamiyasiro様
    御回答有難う御座います。
    おかげさまで、(1)を理解することができました。

    Y5=max{X1,…,X5}のことです。説明不足で申し訳ありません。

    大学の講義ではそこまで専門的なことはご教授頂いておりません。

    No.3の回答に寄せられた補足コメントです。 補足日時:2021/02/13 13:03
  • kamiyasiro様
    お世話になっております。

    (2)についてなのですが、Y5の期待値と分散を求めました。
    (X1,…,X5)は無作為標本であるため、Y5は正規分布に従うと考えました。この際の最大値関数は正規分布に従うのでしょうか。

    講義では統計学の入門までしか学んでおらず、現在独学で学んでいるため浅知恵で申し訳ありません。

      補足日時:2021/02/13 13:53

A 回答 (5件)

企業で統計を推進する立場の者です。



(1)について、

累積分布関数がF(X)である確率変数Xiのn個の最大値は累積分布関数F(X)^nに従います。(参照:https://mathtrain.jp/orderbunpu 最大値が従う分布)

問題の分布は一様分布で、累積分布関数はF(X)=x/cなので、最大値の累積分布関数は、
F(X)=(x/c)^n
になります。

一方、期待値は、スコア関数をg(x)、密度関数をf(x)とすると、
∫g(x)f(x)dx
で与えられます。密度関数は累積関数の微分形だから、
f(x)=nx^(n-1)/c^n
です。
よって、その期待値は、
∫x・nx^(n-1)/c^n dx=nx^(n+1)/(n+1)c^n
0~cの範囲で定積分すると(x=cを代入するだけ)、
E(max(Xi))=nc/(n+1)
となります。

n=1の時は、E(max(Xi))=c/2
n=2の時は、E(max(Xi))=2c/3
・・・
n=∞の時は、E(max(Xi))=cとなります。

(2)について、
Y5、dが分かりません。
    • good
    • 0

#1です。



あの式の累積90%点を求めて使って下さい。
と書きましたが計算は大変です。Rを使ってやってみました。
以下は、最後の少し手前からの計算結果です。

これより累積確率90%を与える点が分かります。

d ≧ 0.979 となります。

Step 横軸の値 最大値分布の累積確率
[971,] 0.970 8.609488e+02
[972,] 0.971 8.653935e+02
[973,] 0.972 8.698566e+02
[974,] 0.973 8.743381e+02
[975,] 0.974 8.788380e+02
[976,] 0.975 8.833565e+02
[977,] 0.976 8.878935e+02
[978,] 0.977 8.924491e+02
[979,] 0.978 8.970234e+02
[980,] 0.979 9.016164e+02
[981,] 0.980 9.062283e+02
[982,] 0.981 9.108590e+02
[983,] 0.982 9.155086e+02
[984,] 0.983 9.201772e+02
[985,] 0.984 9.248648e+02
[986,] 0.985 9.295714e+02
[987,] 0.986 9.342973e+02
[988,] 0.987 9.390423e+02
[989,] 0.988 9.438066e+02
[990,] 0.989 9.485902e+02
[991,] 0.990 9.533932e+02
[992,] 0.991 9.582156e+02
[993,] 0.992 9.630575e+02
[994,] 0.993 9.679189e+02
[995,] 0.994 9.728000e+02
[996,] 0.995 9.777008e+02
[997,] 0.996 9.826212e+02
[998,] 0.997 9.875615e+02
[999,] 0.998 9.925216e+02
[1000,] 0.999 9.975017e+02
[1001,] 1.000 1.002502e+03
    • good
    • 0
この回答へのお礼

御回答有難う御座います。
当サイトの使い方まで教えて頂き、誠に有難う御座います。
かなり詳細な解説で理解することができました。
この度は、貴重なお時間を頂き感謝致します。

お礼日時:2021/02/17 13:43

#1です。



補足があったんですね。
このサイトは「お礼」に書くと回答者にメールが行きますが、補足はいくら書いても回答者には知らされませんので放置されますよ。私は回答が増えていれば注目しますが、そうでなければ「質問者からも放置されている」に見えます。
ご注意ください。

さて、最大値分布は、正規分布には全く従いません。
中央値は、正規分布に近いですよ。
でも、習っていないなら、仕方ないですよね。
それに、ネット情報って往々にして間違っています。
我々実務者は修正して使っているんですが、それも分からないだろうし、こんなところで聞くしかないですよね。

私からしてみれば、あの問題は出題すべきでないし、出題するなら誘導問題が必要と思います。

さて、n=5のときの、最大値、中央値、最小値の分布のグラフを載せます。

最初のグラフは、#1で示したサイトの
「X1,…,Xn のうち,小さい方から k 番目」が従う分布の確率密度関数、に従って描いています。

実際にどうなっているか確認します。n=5の一様乱数を大量に発生させ、ソートして1番目、3番目、5番目の値を集めてヒストグラムにしたのが次のグラフです。

先のサイトでは5番目の値というのは、後ろから数えると0番目の扱いになっているので、それを修正しています。先頭の値も0番目にするのです。

ただし、累積確率紙の場合は、全体をn+1個にして、前からも後ろからも1番目と考えます。ちょっと面倒です。

で、検定は、あの式の累積90%点を求めて使って下さい。
「連続型の最大値分布の期待値」の回答画像4
    • good
    • 0

#1です。



(2)について、ヒントを書きます。

たぶん、Y5って5個の最大値(観測値)の平均ですよね。dは棄却域の値。

この問題を解くには、最大値の平均が従う分布が必要ですよね。一般には、累積確率紙の信頼区間の形になります。確率紙の直線の左右に引かれる曲線です。n番目の観測値の信頼区間は次の論文に書いてあります。

Stirling W.D.(1982);”Enhancements to Aid Interpretation of Probability PLots.”,The statistician 31,pp211-220

http://www.statgenet.med.kyoto-u.ac.jp/wiki_toky …

当然、左右非対称になります。

この問題のケースでは、5番目の観測値が従う分布の上側10%を棄却域とする片側検定をします。c=1のケースを母集団とみなして検定すればOKです。

ところで、こんな専門的なこと(確率紙の信頼区間)を学校(大学?)でやりました?

もし学んでいなければ、漸近正規性を利用して、正規分布に仮定してやるんでしょうかね。その場合は、N(5/6,σ^2)に従うと仮定します。

σの求め方は、E(x^2)-E(x)^2 で分散を求め、その平方根を取ります。第1項の2乗の期待値は、∫x^2・f(x)dx で求まります。

いずれにしても計算は面倒です。ご自分でチャレンジしてみて下さい。
この回答への補足あり
    • good
    • 0

#1です。



∫x・nx^(n-1)/c^n dx=nx^(n+1)/(n+1)c^n



∫x・nx^(n-1)/c^n dx=nx^(n+1)/{(n+1)c^n}

分母にカッコを付けないといけませんでした。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!