ちくのう症(蓄膿症)は「菌」が原因!?

最尤法を勉強しています。一様分布の右端の最尤推定量が、得られたデータの最大値になることがわかりません。直観的にはわかるのですが。。。
確率変数(X1,...,Xn)が一様分布 f(x,t) = 1/t (0<x<=t;0:known,t:unknown)に従うとして、n個の尤度函数はL(t;x)=(1/t)^nになると思うのですが、
この尤度函数を最大化するようなtというのはt=min(Xi)=0?ではないかと考えてしまいます。何が間違っているのでしょうか。
急ぎませんのでよろしくお願いいたします。

A 回答 (3件)

企業でSQCを推進する立場の者です。



既に#1さんが、ズバっと核心を突く回答をしていらっしゃいますが、私は企業人と言うことで易しく説明したいと思います。

(1)一様分布は、次のような確率密度をもちます。つまり確率密度グラフの全体の面積1を底辺の幅で割ったものです。

(確率密度)=1/(x上限ーx下限)

(2)n個のサンプルの尤度関数は、確率密度が一定だから、xiによらず次の式になります。

(尤度関数)=1/(x上限ーx下限)^n

(3)この尤度関数を最大にするには、分母の(x上限-x下限)すなわち底辺の幅を『現在の観測サンプルを含んで』最も小さくすれば良いから、

(x上限)=max(観測サンプル)
(x下限)=min(観測サンプル)

というように、現在のサンプルの上下限値が、一様分布の範囲の最尤推定量になります。

> 何が間違っているか

考えるべき一様分布は、当然『現在の観測サンプルを含んで』いる必要がありますが、それを無視しています。#1さんのご指摘もこれです。
    • good
    • 1
この回答へのお礼

ご回答ありがとうございます。補足も含めて、理解しました。現在の観測サンプルを含んで最も小さくするということを忘れていました。ありがとうございます。

お礼日時:2018/01/25 09:39

#2です。



書き足りませんでした。
なぜ、『現在の観測サンプルを含んで』いることが必要か。
それは、一様分布は上下限値の外側では確率が0ですから、現在の観測サンプルが外に出てしまうと、サンプルの尤度が0になってしまいます。だから『現在の観測サンプルを含んで』いる必要があるのです。
    • good
    • 0

尤度函数を最大化するに当たって、max(Xi)≦t という条件が付いているということをお忘れなのでしょう。

    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。つまり最大化すべきtはmax(X_i)<=tを満たしているからこれより大きなtで一番小さなtを拾うとmax(Xi)になるということでしょうか。

お礼日時:2018/01/25 09:38

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Q精密法について教えてください(統計)

ポアッソン分布の母数λの区間推定の問題なのですが、精密法を用いて推定せよ、との問題があります。標本数nが大きいときは中心極限定理によって正規標本とみなして推定するのが普通だと思うのですが、おそらく精密法というのはそのような近似を行わない推定だと思います。

ある問題の回答において、標本数n=10で、標本和17となる場合の区間推定について次のようにありました。すなわち信頼度95%の区間推定について、下側信頼限界p_Lは自由度34(おそらく17×2)のχ^2分布の上側0.975点(=19.806)を標本数の二倍にあたる20で割って0.990と求まる。他方上側信頼限界p_Uは自由度36(おそらく(17+1)×2)のχ^2分布の上側0.025点(=54.437)を標本数の二倍にあたる20で割って2.722と求まる。これから信頼区間は(0.990,2.722)となる。

独立同分布なポアッソン分布に従う確率変数の和はやはりポアッソン分布に従うと思うので、ちょっとχ^2分布が出てくるのをいぶかしく思っています。手元に教科書がない上、web検索でも見つけられなかったので、ポアッソン分布の母数の区間推定に関する精密法の定義をきちんと教えていただけるとありがく思います。

ポアッソン分布の母数λの区間推定の問題なのですが、精密法を用いて推定せよ、との問題があります。標本数nが大きいときは中心極限定理によって正規標本とみなして推定するのが普通だと思うのですが、おそらく精密法というのはそのような近似を行わない推定だと思います。

ある問題の回答において、標本数n=10で、標本和17となる場合の区間推定について次のようにありました。すなわち信頼度95%の区間推定について、下側信頼限界p_Lは自由度34(おそらく17×2)のχ^2分布の上側0.975点(=19.806)を標本数の二...続きを読む

Aベストアンサー

精密法の公式は、本質的には“ただの部分積分”です。

自由度2nのカイ2乗分布の確率密度関数は
f_{n}(x)=1/{2*(n-1)!} * (x/2)^(n-1) * e^(-x/2)

∫[0~2λ]f_{n}(x)dx
=-1/(n-1)! * λ^(n-1) * e^(-λ) + ∫[0~2λ]f_{n-1}(x)dx
=-Σ(k=1~n-1)e^(-λ)*λ^k/k! + ∫[0~2λ](1/2)e^(-x/2)dx
=-Σ(k=1~n-1)e^(-λ)*λ^k/k! + [1-e^(-λ)]
=1-Σ(k=0~n-1)e^(-λ)*λ^k/k!
=Σ(k=n~∞)e^(-λ)*λ^k/k!

つまり、「自由度2nのカイ2乗分布に従う確率変数が2λ以下になる確率」と「平均λのポアソン分布に従う確率変数がn以上になる確率」が等しいことが言えます。

この余事象をとれば「自由度2nのカイ2乗分布に従う確率変数が2λ以上になる確率」と「平均λのポアソン分布に従う確率変数がn-1以下になる確率」が等しいことが言えます。

いま平均10λのポアソン分布に従う確率変数として17が得られた。
「平均10λのポアソン分布に従う確率変数が17以上となる確率」(λの下側信頼限界を求めるのに利用)=「自由度34のカイ2乗分布に従う確率変数が20λ以下となる確率」
「平均10λのポアソン分布に従う確率変数が17以下となる確率」(λの上信頼限界を求めるのに利用)=「自由度36のカイ2乗分布に従う確率変数が20λ以上となる確率」
ということです。

精密法の公式は、本質的には“ただの部分積分”です。

自由度2nのカイ2乗分布の確率密度関数は
f_{n}(x)=1/{2*(n-1)!} * (x/2)^(n-1) * e^(-x/2)

∫[0~2λ]f_{n}(x)dx
=-1/(n-1)! * λ^(n-1) * e^(-λ) + ∫[0~2λ]f_{n-1}(x)dx
=-Σ(k=1~n-1)e^(-λ)*λ^k/k! + ∫[0~2λ](1/2)e^(-x/2)dx
=-Σ(k=1~n-1)e^(-λ)*λ^k/k! + [1-e^(-λ)]
=1-Σ(k=0~n-1)e^(-λ)*λ^k/k!
=Σ(k=n~∞)e^(-λ)*λ^k/k!

つまり、「自由度2nのカイ2乗分布に従う確率変数が2λ以下になる確率」と「平均λのポアソン分布に従う確率変数がn以上に...続きを読む

Q最尤推定法の考え方

現在統計の勉強をしています.現在,最尤推定法でつまずいていて,自分で調べたりしたのですが,いまいち理解できないので教えてください.

「尤度関数がp(z^k | x)であるとして,事前確率密度関数がp(x)である場合,最大となるp(z^k | x)がp(x)であると推定する」
という考え方でよろしいのでしょうか?

よろしくお願いします.

Aベストアンサー

おそらくz^kはパラメータ、xがデータであり、推定されるp(x)はz^kの打ち間違いだと思います。そうであれば質問者の方の理解は概ね正解に近いです。ただ、事前確率密度関数は最尤法にはない概念です。
一応、最尤法について簡単な説明を書きます。

今、パラメータ(a,b)で表される密度関数 f(a,b) を持つ確率変数 x があったとし、この x の実現値を X={x_1,...,x_n} とします。すると同時密度関数は
g(x_1,...,x_n|a,b)=f(x_1|a,b)×...×f(x_n|a,b)
と書け、尤度関数は
L(a,b|x_1,...,x_n)=g(x_1,...,x_n|a,b)
と定義されます。
この尤度を最大にするパラメータ (a,b) が最尤推定量です。

Q和の共分散の公式について・・・確率変数XYZで

Cov(X+Y、Z)=Cov(X、Z)+Cov(Y、Z)
これって、XとYを足したものとZとの共分散でしょうか?
どなたか、簡単な例で教えて下さい。 XとYの共分散までなら分かります。 40%の確率で期待値がX=20,Y=30,Z=40
60%の確率でX=10、Y=50、Z=30とかだったら上のし式はどうなりますか? 他の例でもけっこうです。

Aベストアンサー

たとえば、3つのデータ
(X,Y,Z) = (1,1,1),(1,2,2),(2,3,2)
があったとすると、
Cov(X,Z) = E(XZ)-E(X)E(Z) = (7/3)-(4/3)(5/3) = 1/9
Cov(Y,Z) = E(YZ)-E(Y)E(Z) = (11/3)-2(5/3) = 1/3
Cov(X+Y,Z) = E((X+Y)Z)-E(X+Y)E(Z) = 6-(10/3)(5/3)=4/9
となりますから、
Cov(X+Y,Z) = Cov(X,Z)+Cov(Y,Z)
が成り立っています。
※Eは平均値の意味です。

質問の後半ですが、期待値だけから共分散を求めることはできません。上のように具体的なデータの組か、(X,Y,Z)3次元の確率分布が必要です。

Q標準正規分布のモーメント母関数

標準正規分布のモーメント母関数を計算した、3次モーメントと4次モーメントを求めたいです。よろしくお願いします。

Aベストアンサー

モーメント母関数をM(t)とすると、モーメント母関数の定義により、M(t)=E(exp(tX))です。ただし、Xは、標準正規分布に従う確率変数で、E( )は、平均値を表すとします。実際に計算すると、

M(t) = exp(t^2/2)

となります(添付図参照)。これの4階までの導関数をとると、次のようになります。

M'(t) = t・exp(t^2/2)
M''(t) = exp(t^2/2) + t^2・exp(t^2/2)
M'''(t) = 3t・exp(t^2/2) + t^3・exp(t^2/2)
M'''(t) = 3exp(t^2/2) + 6t^2・exp(t^2/2) + t^4・exp(t^2/2)

よって、

0回りの3次モーメント = M'''(0) = 0
0回りの4次モーメント = M''''(0) = 3

となります。

Q分布関数と一様分布の関係について

Xを連続型の確率変数として、その分布関数をF(X)としたとき、F(X)は一様分布U[0,1]に従うみたいなのですが、理解できません。初歩的な質問ですがよろしくお願いします。

Aベストアンサー

←No.3 「お礼」欄について:
ああ、そういう質問意図だったか。
それなら、それが判るように書かなきゃね。

関数 F が確率変数 X の分布関数だというのは、
X≦t という事象の起こる確率が F(t) ってこと。
分布関数は単調増加だから、X≦t ⇔ F(X)≦F(t).
つまり、F(X)≦F(t) という事象の起こる確率
が F(t) ってことだ。
F(X)=Y, F(t)=T と記号を置き換えると、
Y≦T という事象の起こる確率が T だと言える。

A No.2 に書いた一様分布 U(0,1) の定義によれば、
それは、Y が U(0,1) に従うってことだよね。

Q確率母関数の定義

確率母関数の定義を詳しく教えてください。

私が知っている範囲ですと,あやふやな確率の母集団の確立を表すことであやふやな確立の近似値を示すことができる。ということです。

不確かなことなので間違っているかもしれませんが,どうかお願いします。

Aベストアンサー

通常、確率母関数というのは、離散値(非負整数値)を取る確率変数のべきモーメントを指します。すなわち、

0を取る確率がp_0、1を取る確率がp_1、2を取る確率がp_2、…
であるような確率分布を考えます。当然p_0+p_1+p_2+…=1となります。
このとき、この(確率)分布の確率母関数G(t)とはt^Xの期待値をいいます。
もっと解りやすく書くと、
G(t)=p_0+p_1t+p_2t^2+p_3t^3+…
のことを言います。べき級数の各係数が、
そのべきを取る確率になっているようなもののことです。
なぜ確率母関数と呼ばれるかというと、次の事実によります。
すなわちG(0)=p_0、G'(0)=p_1、G''(0)=2p_2、
…、G^(n)(0)=n!p_n、…のように、原点での微分係数が
確率を与える(すなわち確率の母というわけです)からです。

通常、連続分布などの場合は、ラプラス変換であるモーメント母関数、
あるいはフーリエ変換である特性関数などを用いますが、
離散値であることがわかっている場合は、確率母関数を用いる方が
計算が容易であることも多く、よく重宝されます。

なぜこれが便利かというと、たとえば二つの確率分布が独立であること
の証明をするのに、確率母関数が積に分解するかどうかを確かめる
だけでよいからです。このことはモーメント母関数でも特性関数でも
まったく同様です。

なお、通常用いられている、分布関数F(x)という用語は、
ある確率変数(あるいは確率分布)で、値x以下を取る確率のことを
指します。したがって確率母関数とは異なる用語です。

通常、確率母関数というのは、離散値(非負整数値)を取る確率変数のべきモーメントを指します。すなわち、

0を取る確率がp_0、1を取る確率がp_1、2を取る確率がp_2、…
であるような確率分布を考えます。当然p_0+p_1+p_2+…=1となります。
このとき、この(確率)分布の確率母関数G(t)とはt^Xの期待値をいいます。
もっと解りやすく書くと、
G(t)=p_0+p_1t+p_2t^2+p_3t^3+…
のことを言います。べき級数の各係数が、
そのべきを取る確率になっているようなもののことです。
なぜ確率母関数と呼ばれるかという...続きを読む

Qe^-2xの積分

e^-2xの積分はどうしたらよいのでしょうか…。e^xやe^2xsinxなどはのってるのですがこれが見つかりません。お願いします。

Aベストアンサー

いささか、思い違いのようです。

e^-2x は、 t=-2x と置いて置換してもよいけれど、牛刀の感がします。

e^-2x を微分すると、(-2)*( e^-2x )となるので、

e^-2x の積分は、(-1/2)*( e^-2x )と判明します。

Qデータが i.i.d であるとはどういう意味を持つ?

まず,i.i.d についての自分の理解が正しいか確認させてください。
(この時点で理解を誤っている可能性もあるので。)
i.i.d は,独立に同一の確率分布に従うということなので,ある n個のデータ{X1,・・・,Xn}がi.i.d であるとは,
例えば,平均μ,標準偏差σのガウス分布から取り出され(同一の確率分布に従う),
各Xiは,その他のXj(i≠j)からの影響を受けない(独立である)。
これらが満たされるとき,i.i.d である。
この理解でいいでしょうか?

また,重回帰においては,以下の資料の3ページに書かれているように
(http://www.econ.hit-u.ac.jp/~bessho/lecture/06/econome/060524MOLS2.pdf)
X,Yは,i.i.d である必要があるといわれていますが,なぜ,i.i.d でなくてはならないのでしょうか?
i.i.d である場合とそうでない場合とで何が違うのでしょうか?

Aベストアンサー

i.i.d.の定義についてはそれでいいのでは。
http://en.wikipedia.org/wiki/Independent_and_identically-distributed_random_variables

後半について。
別に、i.i.d.でなくても、形式的に回帰を考えることは可能ですが。
もともと、回帰を考えるのは、
ある集団があるとして、そいつらの、平均的な性質を知りたいからでしょう。
とすれば、
・「独立であること」はつまり、考えている集団からサンプルを偏りなく選んだ、ということです。世論調査するときに、特定の年齢層ばかり集めてくれば(サンプルの間に相関がある)、でてきた結果もおかしいでしょう。
・「同分布であること」は、そもそも、サンプルを考えている集団からとってきた、てことです。日本の世論調査をしているときに、アメリカ人に聞いたらダメでしょう。

Q逆行列の微分

Aが正則な行列のとき、

dA^{-1}/dt=-A^{-1}・(dA/dt)・A^{-1}

A^{-1}はAの逆行列
であると聞きましたが、この式がどうしても導出できません。

まわりの人たちに聞いたら、
「A^{-1}を微分したらマイナスAのマイナス2乗になるでしょ?」
と言われましたが、A^{-1}の-1は指数ではなくインバースの記号なので、
その返答がうさんくさいように思えてなりません。
逆行列の成分ごとに計算しようとしましたが、
余因子展開やら何やら行なっても式が複雑になるだけで、解決しませんでした。
夕方からつっかかって、気になって仕方がありません。助けてください。

Aベストアンサー

以下は dA/dt を A' と表現します。

2つの行列の積の微分が以下のようになるのはいいですよね。

(A・B)' = A'・B + A・B'

A^{-1}が微分可能であることは成分を考えれば明らか
です。ここで、以下の両辺を微分します。

A・A^{-1} = E

結果は

A'・A^{-1} + A・A^{-1}' = O

これに左から A^{-1} を掛ければ出来あがりです。

Qeのマイナス無限大乗

lim(t→∞) 1-e^(-t/T)
T:定数

というのがあって、極限値が1になることは手計算で分かったのですが、
数学的に1になる理由が分かりません。

e^(-∞)=0になる理由を数学的に教えてください。

Aベストアンサー

e^(-n) = (1/e)^n
であり、
0<|1/e|<1
だから


人気Q&Aランキング