ある一つの変数に対するデータを数多く収集したとします.一人ひとりに一つづつ値がある身長などです.それを使って身長に関する確率密度を求めたいと思った場合,どのような操作手順になるでしょうか.例えば,最低身長を1mとして5cm刻みのレンジでその中に入る度数を調べて全数で除して,棒グラフみたいなものができたとします.そのグラフの縦軸は確率という次元(無次元)になります.横軸は身長ですね.そのようにしててきたグラフは実は確率密度ではないと思います.なぜなら,確率密度関数を横軸(身長)で積分したら確率になるのだから確率密度関数は身長の逆数の次元を持つ必要があります.そうしますと,例えば先に求めた5cmのレンジに対応して求まった確率をその刻み幅5cmで除す必要があるでしょうか.
このようなことが明記されているテキストがありましたら教えて頂きたいのですが.私の見る限りでは確率密度関数を実際のデータから求めるという演習が載っているものがなく,すべて確率密度関数が与えられているという前提での演習ばかりです.

よろしくお願いします.

このQ&Aに関連する最新のQ&A

A 回答 (7件)

>確率密度関数の定義を明確にすること


は,そのとおりです。
定義とともに,どのような仮定(前提)で話を進めるかが重要です。

確率や統計は,身近にあることが対象となりうるために,かえって定義が曖昧になっているような気がします。

かなり確率を学んでいる(私よりかも・・)ようなので,蛇足かもしれませんが,ビュッホン(Buffon) やベルトラン(Bertrand)の問題では,定義が不明確のため解答に混乱を招いてます。
(参考)
http://www.core.kochi-tech.ac.jp/m_inoue/work/ma …

>すなわち連続型の確率論が先に来るというのが正しいのでしょうか

先に来る,という意味が,はっきりしませんが,連続型で全て表せると考えてもいいでしょう。

確率論でデイラックδ関数を取り上げ,離散も連続も積分を使って一般的議論という解説もあります。古典力学と量子力学の橋渡し,ですね。

>レンジの確率密度関数でなく,その単位レンジの密度関数です。というのは確率密度関数の定義が既に先にある,ことを意味していると思います.

ここも微妙ですが,「 確率 」密度関数とまでは言っていません。その点,注意深く言ったつもりです。自分でも間違いやすいので・・・

棒グラフで止めれば,「離散密度関数」でしょうし,さらに,後半で話したように,曲線近似までもっていけば,「確率密度関数」です。

>確率・統計という学問は解析とか代数という数学分野とちょっと異なっているように思います。

全くそうですね。冒頭述べた,身近にある,ありすぎる点から,問題をややこしくしています。

>確率・統計については逆に実際に計算する手法が先にあってそれが定義であるかのように理解してしまう側面があるのではないでしょうか.

これも全く同意です。
例えば,
誰もが誤差分布の正規性を信じている。実験家は、数学的定理であると思っ ているからであり、数学家は、実験的事実と思っているからである。 (クラメール)
なんて言葉もあるくらいです。

また,統計の計算手法をめぐっては,ここの回答No1にも出てきたsanoriさんと真っ向から対立したくらいですから,
http://oshiete.goo.ne.jp/qa/6733154.html
計算,それが定義,という面はあると思います。


>数学的な厳密性に対して反乱することがほぼできません.
私も応用分野の人間ですから,そんなものですよ。

>私が挙げた箇条書きの計算手順で循環論になる部分があるとしたらどの部分でしょうか

2.各レンジの度数をレンジ幅で除したリスト(棒グラフ)を作成する.
3.そのリストを積分して値Sを求める.理屈から考えると総サンプル数になるが.

の部分です。各レンジは,総サンプル数が得られたからこそ決められます。例えば,あとからサンプルを加えて行けば,レンジが変わることもあるでしょう。

その決められたはずの総サンプル数に計算を施して,総サンプル数を求める,総サンプル数が求まったら,レンジを決める,決めたら総サンプル数を求める計算をする・・・

こういうことですか?
それなら,不要な計算です。
    • good
    • 0

すみません,No4訂正です。



私の示した例では,
5 cm 当たり,でなく,10 cm 当たり(10cm幅)でした。
    • good
    • 0

No4の図が、うまくUPできなかったようなので,ここに再掲です。

「確率密度関数の求め方について」の回答画像5
    • good
    • 0

少々わかりづらい点があるのですが。

。。

例えば,身長が
150cm以上160cm未満,10人
160cm以上170cm未満,10人
170cm以上180cm未満,10人
の合計30人いたとします。

それぞれの絶対度数10人を合計の30人で割って,相対度数を求めると
150cm以上160cm未満,1 / 3
160cm以上170cm未満,1 / 3
170cm以上180cm未満,1 / 3
となります。

人数を人数で割ったので,「無次元」と言っているのではないかと思いますが,いかがでしょうか?

もしそうなら,絶対度数とか相対度数(あるいは割合)という言葉を入れてください。
そうでないと分かりにくい。

もし以上の私の推察が正しければ(質問者の意図を誤解してなければ),以下の解説を参考にどうぞ。

回答No1のお礼に示した

2.各レンジの度数をレンジ幅で除したリスト(棒グラフ)を作成する.
3.そのリストを積分して値Sを求める.理屈から考えると総サンプル数になるが.
4.各リストをSで除した値(規格化)がそのレンジの確率密度関数となる.

は,間違いではありませんが,あまり良い方法でなく,また,循環論にもなっています。

例えば,
2.度数をレンジ幅で除するような2次操作をせずに,最初から,レンジ幅を調節(例えば,1cm)として,そこに落ちるデータ数を数えたほうが,生データをそのまま使えて正確です。

3.Sは,総サンプル数なのに,なぜ,わざわざ積分で求めるのでしょうか?

4.各リストをSで除した値(規格化)がそのレンジの確率密度関数.
変ですよ。2で,リストは,除されたレンジ幅(単位レンジ幅,例えば,1cmあたり)の度数となっています。だから,求めたのは,レンジの確率密度関数でなく,その単位レンジの密度関数です。

それなら,最初から単位レンジ幅を定め,その中のデータ数を求めて,そこから密度関数を割り出せば良いことです。

そもそも,問題が離散なのか連続なのか,混同した話になっています。

確率密度関数という用語は,通常,連続分布に使います。

上記のような離散分布の例では,確率質量関数(probability mass function)とか離散密度関数とか確率離散関数とか言われます。私も,このような離散と連続に対する用語の区別に賛成です。

それでは,まず,離散分布の場合。
上記例に示したように,離散密度関数は
1 / 3, 1 / 3, 1 / 3
となります。質問者が言うとおり,無単位(無次元と言うより,こちらのほうが良い)のように見えます。

その和は,
1 / 3 + 1 / 3 + 1 / 3 = 1
です。

しかし,これは無単位というわけではありません。「5cm当たりの確率」を示すからです。
あえて単位をつければ,1 / (5 cm) となります。
回答No1の指摘に近いものですが,私の推察どおりで,既に全数で割った話(つまり比率)なら,人 / (5 cm) のように「人」が付くことはありません。

通常は,このような,1 / (5 cm) は書かれていません。階級(この場合,5 cm)の逆数になるので,書かなくても分かるからです。

したがって,上記の和は,正確に書くと,それぞれ,
高さが,(1 / 3 )/ (5 cm)
幅が,5cmなので,
面積は,高さ*幅より,
(1 / 3 )/ (5 cm) *(5cm) + (1 / 3 )/ (5 cm) *(5cm)+ (1 / 3 )/ (5 cm) *(5cm)
= 1 / 3 + 1 / 3 + 1 / 3 = 1
となります。

ただしこれは,幅をcm (本例では,5cm)で表そうが,mm (本例では,50mm)で表そうが,m (本例では,0.5 m)で表そうが,
1 / 3 + 1 / 3 + 1 / 3 = 1
です。
つまり,x軸の単位に影響されません。いくつに区分するか(本例では,3)によって確率が変わります。

次に,連続分布の場合。
上述の離散分布に類似して,区間 150 cm ≦ x ≦180 cm で,一様確率密度関数を考えます。
すると,
f(x) = 1 / (180 - 150) = 1 / 30  (150 cm ≦ x ≦180 cm)
f(x) = 0  (その他のx)
となります。
添付図左です。当然,面積は,30 *(1 / 30) = 1です。

ここでも,図の縦軸に「単位」が示してあることに注意してください。
通常は,これも書かれていません。x軸単位の逆数になるので,書かなくても分かるからです。

そして,確率は無単位,という思い込みの落とし穴がここにあります。
左図の縦軸は,いわば「1cm当たり」の出現率を示しています。
さきほど述べた,「単位幅」に相当します。

ここで,単位をcmの代わりに,mとしてみましょう。

一様確率密度関数は,
f(x) = 1 / (1.8 – 1.5) = 1 / 0.3 = 1 0/ 3  (1.5 m ≦ x ≦1.8 m)
f(x) = 0  (その他のx)
となります。
添付図右です。これも,面積は,0.3 *(10 / 3) = 1です。
縦軸は,「1m当たり」の出現率を示しています。その値が,1を超えている点も注意しましょう。

両方とも,全体面積は1であり,10cm (0.1m)間隔で調べると,1/3 となります。
しかしながら,x軸の単位をどう取るかで,確率密度関数は異なってきます。

縦軸は,確率と呼ぶより,x軸に示された単位当たりの出現率を示しており,その関数が確率密度関数となります。

しかし,前述のとおり,それはx軸を見れば分かることなので,わざわざ「x軸に示された単位当たりの確率密度」と書かないで,せいぜい「確率密度」とか「相対頻度」などと書かれる程度です。

人口密度などという場合と同様に,確率密度というわけは,このように,ある単位あたりの出現割合を示すことから来ています。

離散分布の場合,離散密度関数をp(x)とすると
∑p(x) = 1
であり,
0 ≦ p(x) ≦ 1
です。
一方,連続分布の場合,確率密度関数をf(x)とすると,
∫f(x) = 1
ですが,
f(x) は,非負,つまり f(x) ≧ 0 というだけで,1を超えることもある点に注意しましょう。
これは上記でも説明したとおりです。

>確率密度関数が与えられている問題ばかり
ある意味当然のことです。

離散分布でも連続分布でも,事象の出現確率をどう関数で示す(近似する)か,という問題となります。したがって,既に知られた分布(例えば,ポアッソン分布とか正規分布とか)で近似できるかどうかという問題に帰着されるからです。もし,xを変数変換(例えば対数など)しても,既知のどの分布にも適合せす,新たに適合する密度関数を見つけられれば,それだけで優れた発見となるでしょう。

それでもなお,自分なりに密度関数を作ろうとすれば,
∑p(x) = 1 (0 ≦ p(x) ≦ 1)
または
∫f(x) = 1 (f(x) ≧ 0)
に合うように,p(x)なりf(x)を定めてやれば良いのです。
だから,質問者の考える方向性は誤っていません。
「確率密度関数の求め方について」の回答画像4
    • good
    • 0
この回答へのお礼

大変示唆に富む回答を頂き,ありがとうございます.
現在,この回答を印刷して検討しているところです.また途中までしか読み通しておりませんが,前段部分までの内容について私の考えを述べたいと思います.

この一連の議論(私の元発言でも)において確率分布とか確率密度関数などの定義に触れられていないように思います.その部分が不明確のまま実例として確率密度関数の計算方法の手順をお尋ねしています.しかしながら一般的なテキストでは確率・統計では実例の方(サイコロとか宝くじとか)が先にあってそれらを元にして計算手順を示してからそのような物が確率密度関数である,という風な展開になっているように思います.
従って確率密度関数の定義を明確にすること,すなわち連続型の確率論が先に来るというのが正しいのでしょうか.

回答者さまのコメント:
>変ですよ。2で,リストは,<中略>となっています。だから,求めたのは,レンジの確率密度関数でなく,その単位レンジの密度関数です。

というのは確率密度関数の定義が既に先にある,ことを意味していると思います.

また,以下のコメント:
>3.Sは,総サンプル数なのに,なぜ,わざわざ積分で求めるのでしょうか?

箇条書きした私の計算手順の中にもまだ連続量的なことが何も定義されていないのにその手順の中に”積分”のなどと軽々しく言っているわけで定義とか計算手順がごちゃまぜになっています.

このあたりのことをしっかり整理したいと言う気持ちがあります.

以下,ちょっと大げさになるかも知れませんが,確率・統計という学問は解析とか代数という数学分野とちょっと異なっているように思います.
例えば力学現象は解析的に表現されており,それが厳密であることがとりあえず承認されています.それを離散的に近似してシミュレーションが行われていると思います.言わば学問的な教義の有り様が固定されているわけです.私が確率・統計に対してそのような理解が不足しているのでこのような質問が出てくるのだと思います.
確率・統計については逆に実際に計算する手法が先にあってそれが定義であるかのように理解してしまう側面があるのではないでしょうか.
”計算手順=定義”という混乱です.

私は先に述べた力学現象側の人間なので,数学的な厳密性に対して反乱することがほぼできません.しかし,確率・統計は具体例の方が優先されて理論が規定されていくのではないでしょうか.だから,確率・統計では発見者の名を冠した理論が多いように思います.

以上,大げさな展開となっておりますが,確率密度関数の根本的な定義についてお考えを頂ければと存じます.
また,私が挙げた箇条書きの計算手順で循環論になる部分があるとしたらどの部分でしょうか.どこかに”ある定義の中にその定義が含まれる”ということじゃないのかなと思いますが.

お礼日時:2011/06/26 10:52

確率密度を推定する方法ならあります。



density estimationで調べれば、推定する方法がたくさん出てきますし、本もあります。
しかしながら、これらの方法は密度の形状を推定するものであって、関数形を特定するものではありません。

今後、統計学を学ばれれば分かることと思いますが、確率密度関数を推定したいなら、まず身長という確率変数が従っている分布にパラメトリックな分布(正規分布やガンマ分布などなど)を仮定し、最尤法で分布の形を特定することならできます。
    • good
    • 0

そのとおりです。



ちょっと補足しますと、
区間を細切れにすると、それだけ関数の精度は上がるのですが、
サンプル数(人数)がそれほど多くないなどの理由で棒グラフ(というかヒストグラム)のてっぺんがぎざぎざになるようだと、当てはめた関数(多項式近似など)が適切なのかどうかが判定しづらくなります。

(工業の品質管理のQC七つ道具のテキストに、たしか、ヒストグラムの区間の刻み幅を簡単に最適化する方法が書かれていますが、昔勉強したことなので忘れてしまいました。)
    • good
    • 0

こんにちは。



>>>横軸は身長ですね.

はい。そうです。

>>>そのグラフの縦軸は確率という次元(無次元)になります.

いいえ。 人/(5cm) という次元になります。
そして、棒の高さを全部5分の1に縮めると、人/cm になります。

しかるのち、総面積(総人数)が1(1人)になるように規格化すると、
縦軸の単位が 1/cm で、横軸の単位が cm の確率密度関数のグラフになります。
    • good
    • 0
この回答へのお礼

ありがとうございます.箇条書きにすると以下のようでしょうか.
1.レンジ幅(5cmなどを決めて)その中に入る度数をカウントする.
2.各レンジの度数をレンジ幅で除したリスト(棒グラフ)を作成する.
3.そのリストを積分して値Sを求める.理屈から考えると総サンプル数になるが.
4.各リストをSで除した値(規格化)がそのレンジの確率密度関数となる.

お礼日時:2011/06/25 22:51

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q確率密度関数の四則演算

http://oshiete.goo.ne.jp/qa/8571563.html

このページで二つの独立した確率密度関数の
足し算と掛け算の確率密度関数に関してご回答いただいたのですが

x + y の確率密度関数が二等辺三角形

x × y の確率密度関数が-ln(t)

になるのはどういう計算を行っているのでしょうか?

検索しても調べてみたのですが
解説ページが見つかりませんでした。
解説ページなどあれば教えてください。

Aベストアンサー

かのご質問ではコタエばかりが求められており、かつ、あんまり適切な回答がないようなので、結果だけをカキコしたのでしたが、こりゃ、セキニンとらんといかんですかね。

 正規分布を日常的に使っているくせに、意味がよく分かってない人がちょいちょいいます。「平均0、分散1の正規分布に従う確率変数pがp=0となる確率P(0)は?」と尋ねてみると分かってるかどうかがテストできます。P(0)=0と正しく答えられるかどうか。
 もし、あれれ? となる場合には[1]から、そんなの分かってると仰るのなら[2]からどうぞ。

[1] 「確率変数xが確率密度関数φ(x)に従う」とは、Δaがうんと小さい正の実数のとき、mΔa≦x<(m+1)Δa(すなわちx∈[mΔa,(m+1)Δa))となる確率をP(x∈[mΔa,(m+1)Δa))と書くと
  lim[Δa→0] P(x∈[mΔa,(m+1)Δa))= φ(mΔa)Δa
だってことです。特にxが一様分布φ1(x)に従うのであれば、
  lim[Δa→0] P(x∈[mΔa,(m+1)Δa))= φ1(mΔa)Δa
である。
 さて、x∈[mΔa,(m+1)Δa)であるとします。このとき、z=x+yの分布はどうなるか。ただしyがφ1(y)に従い、しかもyはxとは独立である。簡単ですね。y=z-aなのだから、もちろんzは φ1(z-mΔa)に従う。
 言い換えれば、x∈[mΔa,(m+1)Δa)であって、Δbがうんと小さい正の実数のとき、nΔb≦z<(n+1)Δbとなる条件付き確率は
  P(z∈[nΔb,(n+1)Δb) | x∈[mΔa,(m+1)Δa)) = φ1(nΔb-mΔa)Δb
です。だからz∈[nΔb,(n+1)Δb)となる確率は
  P(z∈[nΔb,(n+1)Δb)) = lim [Δa→0] Σ{n=-∞〜∞} P(z∈[nΔb,(n+1)Δb) | x∈[mΔa,(m+1)Δa)) P(x∈[nΔa,(n+1)Δa))
   = lim [Δa→0] Σ{n=-∞〜∞} φ1(nΔb-mΔa)Δb φ1(nΔa)Δa
   = ∫{a=-∞〜∞} φ1(nΔb-a)Δbφ1(a) da
と書ける。zが従う確率密度関数をφa(z)とすると、
  lim[Δb→0] P(z∈[nΔb,(n+1)Δb)) = φa(nΔb)Δb
なので、
  lim[Δb→0] (φa(nΔb) - P(z∈[nΔb,(n+1)Δb))/Δb )= 0
つまり
  φa(b) - ∫{a=-∞〜∞} φ1(b-a)φ1(a) da
ここでbをz, aをxに書き換えてみると
  φa(z) = ∫{x=-∞〜∞} φ1(z-x)φ1(x) dx
となります。

[2] 一般に、
   (f*g)(z) = ∫{x=-∞〜∞} f(z-x)g(x) dx
を 「fとgの畳み込み(convolution)」と呼びます。
 なお、(f*g) = (g*f) が成り立つことは容易に証明できます。畳み込みは信号処理・画像処理における「フィルター」、制御工学における「伝達関数」の作用を表すのにも使われる、とても重要な概念です。
 これを使って、

定理:「確率密度関数f(x)に従うxと、xとは独立で確率密度関数g(y)に従うyについて、z=x+yは確率密度関数(f*g)(z)に従う」
 (これは、上記[1]の計算をfとgを使ってやり直してみれば証明できるでしょ。)

[3] では、確率密度関数f(x)に従うxと、xとは独立で確率密度関数g(y)に従うyについて、t=xyはどんな確率密度関数に従うか。
 t=xyの両辺の対数をとって
  ln(t) = ln(x) + ln(y)
とし、ln(t), ln(x), ln(y)をそれぞれ T, X, Yという確率密度関数だと考えれば、「確率密度関数f(X)に従うXと、Xとは独立で確率密度関数g(Y)に従うYについて、T=X+Yは確率密度関数(f*g)(T)に従う」わけです。
 xがφ1(x)に従うとき、X = ln(x)がどんな確率密度関数fに従うか。これは簡単でしょうからご自分で。Tが従う確率密度関数は(f*f)(T)です。あとは t = exp(T) がどんな確率密度関数に従うか、という問題を解けば、おしまいです。

 「分かりやすい」をお求めですけど、すらすら行かない場合でも、少なくとも2〜3日ぐらいは粘ってみて下さいな。七転八倒することが地力を付けること。こんなの慣れちまえば鎧袖一触です。

かのご質問ではコタエばかりが求められており、かつ、あんまり適切な回答がないようなので、結果だけをカキコしたのでしたが、こりゃ、セキニンとらんといかんですかね。

 正規分布を日常的に使っているくせに、意味がよく分かってない人がちょいちょいいます。「平均0、分散1の正規分布に従う確率変数pがp=0となる確率P(0)は?」と尋ねてみると分かってるかどうかがテストできます。P(0)=0と正しく答えられるかどうか。
 もし、あれれ? となる場合には[1]から、そんなの分かってると仰るのなら[2]からどうぞ。...続きを読む

Q確率変数XとYはf(x,y)=cxy^2(0

宜しくお願い致します。

[Q]The random variables X and Y have a joint probability density function given by f(x,y)=cxy^2 for 0<x<y<2 and 0 elsewhere
a) Find c so that f is indeed a probability density function.
b) Find P(X<1,y>1/2).
c) Find the probability density function of X.

[問]確率変数XとYはf(x,y)=cxy^2(0<x<y<2でそれ以外は0)で与えられた同時確率密度関数を持つとする。
(a) fが本当に確率密度関数であるようなcを求めよ。
(b) P(X<1,Y>1/2)を求めよ。
(c) Xの確率密度関数を求めよ。

[(a)の解]fが本当に確率密度関数なら∫_y∫_xf(x,y)dx=1.
∫[0..2]∫[y..0]cxy^2dxdy=∫[0..2]cy^2[x^2/2]^y_0dy
=∫[0..2]cy^2(y^2/2)dy=c/2∫[0..2]y^4dy=c/2[y^5/5]^2_0
=c/2(32/5)=32c/10=1. ∴c=5/16

[(b)の解]P(X<1,Y>1/2)=∫[1/2..2]∫[0..1]5xy^2/16dxdy
=∫[1/2..2]5y^2/16[x^2/2]^1_0dy
=∫[1/2..2]5y^2/16・(1/2)dy
=5/32∫[2..1/2]y^2dy
=5/32[y^3/3]^2_1/2
=5/32[8/3-1/8/3]
=0.41

[(c)の解]f_x(X)=∫_yf(x,y)dy=∫[0..2]5xy^2/16dy
=5x/16[y^3/3]^2_0=5x/16(8/3)=5x/6

で(c)の解が間違いだったのですが正解が分かりません。
正解はどのようになりますでしょうか?

宜しくお願い致します。

[Q]The random variables X and Y have a joint probability density function given by f(x,y)=cxy^2 for 0<x<y<2 and 0 elsewhere
a) Find c so that f is indeed a probability density function.
b) Find P(X<1,y>1/2).
c) Find the probability density function of X.

[問]確率変数XとYはf(x,y)=cxy^2(0<x<y<2でそれ以外は0)で与えられた同時確率密度関数を持つとする。
(a) fが本当に確率密度関数であるようなcを求めよ。
(b) P(X<1,Y>1/2)を求めよ。
(c) Xの確率密度...
続きを読む

Aベストアンサー

うーん、前回の質問といい、なぜ前の2問ができてこれを間違うのでしょう?
発展問題というより、視点を変えただけで難易度も考え方も同じです。
今回は前回よりは勘違い度が低いのできちんと書いておきます。

f(x,y)=cxy^2(0<x<y<2でそれ以外は0)
なのですからyの積分範囲は下限x,上限2ですね。

5x/16∫[x,2]y^2dy=5x/16 * [y^3/3]^2_x=5x/48 * (8-x^3)
(=5x/6-5x^4/48)

Q「累積確率密度」という言葉の意味

確率密度関数の定積分値は、普通は「確率」または「累積密度」と言うと思いますが、これを「累積確率密度」と言うのは正しいでしょうか。

もし正しくないとするなら、「累積確率密度」という言葉はどんな意味を表すでしょうか。

Aベストアンサー

正しいと思います。
「累積確率密度」を縮めて「累積密度」と言っているだけのようです。
因みにGoogleで検索すると
累積確率密度関数・・430件
累積密度関数・・・・714件
ヒットします。

Q連続型確率変数の確率密度関数

分数が出てくるとどうしてもわかりません。
図書館で何冊も本を借りたのですが,同じような問題がありません。
良かったら,教えてください。

f(x)=a(1-x/5) (0≦x≦5)
f(x)=0 (その他)

(1)aの値を求める
(2)Xの平均を求める
(3)分散を求める
(4)中央値を求める

よろしくお願いします。

Aベストアンサー

ルートだと間違って見てました。すみません。

∫〔0~5〕a(1-x/5)dx=1

a∫〔0~5〕1dx-x/5*a∫〔0~5〕xdx=a〔x〕[0~5]-1/5a*〔1/2x~2〕[0~5]=1

5a-1/5*25/2=1

よって、a=7/10 ・・・答え

分数は、∫の前にもってくるといいです。

参考URL:http://www004.upp.so-net.ne.jp/s_honma/derivative/derivative.htm

Q確率密度関数の求め方について

ある一つの変数に対するデータを数多く収集したとします.一人ひとりに一つづつ値がある身長などです.それを使って身長に関する確率密度を求めたいと思った場合,どのような操作手順になるでしょうか.例えば,最低身長を1mとして5cm刻みのレンジでその中に入る度数を調べて全数で除して,棒グラフみたいなものができたとします.そのグラフの縦軸は確率という次元(無次元)になります.横軸は身長ですね.そのようにしててきたグラフは実は確率密度ではないと思います.なぜなら,確率密度関数を横軸(身長)で積分したら確率になるのだから確率密度関数は身長の逆数の次元を持つ必要があります.そうしますと,例えば先に求めた5cmのレンジに対応して求まった確率をその刻み幅5cmで除す必要があるでしょうか.
このようなことが明記されているテキストがありましたら教えて頂きたいのですが.私の見る限りでは確率密度関数を実際のデータから求めるという演習が載っているものがなく,すべて確率密度関数が与えられているという前提での演習ばかりです.

よろしくお願いします.

Aベストアンサー

>確率密度関数の定義を明確にすること
は,そのとおりです。
定義とともに,どのような仮定(前提)で話を進めるかが重要です。

確率や統計は,身近にあることが対象となりうるために,かえって定義が曖昧になっているような気がします。

かなり確率を学んでいる(私よりかも・・)ようなので,蛇足かもしれませんが,ビュッホン(Buffon) やベルトラン(Bertrand)の問題では,定義が不明確のため解答に混乱を招いてます。
(参考)
http://www.core.kochi-tech.ac.jp/m_inoue/work/math_tale/01.pdf

>すなわち連続型の確率論が先に来るというのが正しいのでしょうか

先に来る,という意味が,はっきりしませんが,連続型で全て表せると考えてもいいでしょう。

確率論でデイラックδ関数を取り上げ,離散も連続も積分を使って一般的議論という解説もあります。古典力学と量子力学の橋渡し,ですね。

>レンジの確率密度関数でなく,その単位レンジの密度関数です。というのは確率密度関数の定義が既に先にある,ことを意味していると思います.

ここも微妙ですが,「 確率 」密度関数とまでは言っていません。その点,注意深く言ったつもりです。自分でも間違いやすいので・・・

棒グラフで止めれば,「離散密度関数」でしょうし,さらに,後半で話したように,曲線近似までもっていけば,「確率密度関数」です。

>確率・統計という学問は解析とか代数という数学分野とちょっと異なっているように思います。

全くそうですね。冒頭述べた,身近にある,ありすぎる点から,問題をややこしくしています。

>確率・統計については逆に実際に計算する手法が先にあってそれが定義であるかのように理解してしまう側面があるのではないでしょうか.

これも全く同意です。
例えば,
誰もが誤差分布の正規性を信じている。実験家は、数学的定理であると思っ ているからであり、数学家は、実験的事実と思っているからである。 (クラメール)
なんて言葉もあるくらいです。

また,統計の計算手法をめぐっては,ここの回答No1にも出てきたsanoriさんと真っ向から対立したくらいですから,
http://oshiete.goo.ne.jp/qa/6733154.html
計算,それが定義,という面はあると思います。


>数学的な厳密性に対して反乱することがほぼできません.
私も応用分野の人間ですから,そんなものですよ。

>私が挙げた箇条書きの計算手順で循環論になる部分があるとしたらどの部分でしょうか

2.各レンジの度数をレンジ幅で除したリスト(棒グラフ)を作成する.
3.そのリストを積分して値Sを求める.理屈から考えると総サンプル数になるが.

の部分です。各レンジは,総サンプル数が得られたからこそ決められます。例えば,あとからサンプルを加えて行けば,レンジが変わることもあるでしょう。

その決められたはずの総サンプル数に計算を施して,総サンプル数を求める,総サンプル数が求まったら,レンジを決める,決めたら総サンプル数を求める計算をする・・・

こういうことですか?
それなら,不要な計算です。

>確率密度関数の定義を明確にすること
は,そのとおりです。
定義とともに,どのような仮定(前提)で話を進めるかが重要です。

確率や統計は,身近にあることが対象となりうるために,かえって定義が曖昧になっているような気がします。

かなり確率を学んでいる(私よりかも・・)ようなので,蛇足かもしれませんが,ビュッホン(Buffon) やベルトラン(Bertrand)の問題では,定義が不明確のため解答に混乱を招いてます。
(参考)
http://www.core.kochi-tech.ac.jp/m_inoue/work/math_tale/01.pdf
...続きを読む

Q2つの確率変数と確率密度関数の問題

いつもお世話になっております_ _
夏までに確率と統計の本を1冊頑張ろうとやっておりますが
再び躓きました、、

問題は添付画像の通りです
どういうステップを踏んでいくのか分からず、
例題や章のはじめの簡単な解説から、
X,Yが独立⇔h(x,y)=f(x)*g(y)
を使うのかなと思いましたが、やっぱりよく分かりませんでした

解説をお願いします(_ _)

Aベストアンサー

P(0<=X<=1/2,1/2<=Y<2/3)
=∫∫[0<=x<=1/2,1/2<=y<2/3] f(x)*f(y)dxdy
=∫[0<=x<=1/2] f(x)dx∫[1/2<=y<2/3] f(y)dy
=∫[0<=x<=1/2] 1dx∫[1/2<=y<2/3] 1dy
=(1/2)*{(2/3)-(1/2)}
=(1/2)*(1/6)
=1/12

Q標準正規分布表における確率密度関数値

 ある資格試験問題に、次のような表がありました。

確率変数   分布関数値    確率密度関数値
 0.00     0.5000       0.3938
 0.50     0.6915       0.3521
 1.00     0.8413       0.2420
 1.50     0.9332       0.1296
 2.00     0.9773       0.0540
 2.50      0.9938       0.0175
 3.00      0.9987       0.0044
 3.50      0.9998       0.0009

分布関数値のほうはよくわかります。(皆さんもおなじみの数値です。)これを使えば、たとえば、P(-2.00≦Z≦2.00)=0.9546 ・・・・・1-(1-0.9773)×2=0.9546 です。

ところが、この表に出てくる確率密度関数値は、何に使えるのか、見当がつきません。一体この確率密度関数値とは何者ですか?さらに、確率密度関数値としてこの表に並んでいる数値は一体何の意味があるのですか?どうぞよきアドバイスをよろしくお願いいたします。

 ある資格試験問題に、次のような表がありました。

確率変数   分布関数値    確率密度関数値
 0.00     0.5000       0.3938
 0.50     0.6915       0.3521
 1.00     0.8413       0.2420
 1.50     0.9332       0.1296
 2.00     0.9773       0.0540
 2.50      0.9938       0.0175
 3.00      0.9987       0.0044
 3.50      0.9998       0.0009

分布関数値のほうはよくわかりま...続きを読む

Aベストアンサー

>この計算をするときには、 確率密度関数値 は全く必要ないわけですね?

A#3の繰り返しになりますが
P(Z≦-2.00or2.00≦Z)の計算では
確率変数2.00の時の分布関数値F(2.00)=0.9773だけを使えば計算でき
他の分布関数値や密度関数値の数値は使いませんね。

>『    』の中身の文章は、正解ですか?
正解です。

Q確率・統計 確率変数 密度関数 期待値

私は,微分・積分を学んでいないので下の問題の答えがなぜ,3/5になるのかわかりません。
途中式なども交えて詳しく教えていただけると助かります。

Aベストアンサー

企業で統計を推進する立場にある者です。

どうしても微積の知識が必要になります。
ですから、途中の式を省略せずに書きます。

確率密度関数とは、横軸の何らかのスコアがどんな頻度で出現するかを表した関数です。
瞬間瞬間の出現確率を縦軸で表しています。
そして、その面積は1になっています。全体で100%であるから面積1なのです。
ちなみに、今の問題で面積を求めるために積分すると、
∫12(x^2-x^3)dx=12(1/3*x^3-1/4*x^4)=4x^3-3x^4
これに積分区間を代入して計算するとキチンと1になります。

さて、横軸のスコアxの期待値は、
横軸のスコアの関数をg(x)とすると、その期待値(平均)は
E(g(x))=∫g(x)f(x)dx
となります。これを1次の積率と言います。公式というか、定義ですので
証明せずに使用してもいいです。

ヒストグラムをイメージした時、
横軸の値と、その項の高さを掛けて足したものが平均になりますが、
その刻み方を究極まで細かくしたものが、この積分なのです。

さて、答ですが、今、g(x)=xなので、
E(g(x))=12*∫x(x^2-x^3)dx=12*∫(x^3-x^4)dx=12(1/4*x^4-1/5*x^5)
=3x^4-12/5x^5
これに積分区間を代入して計算すると、(0の代入部分を端折っています)
3-12/5=15/5-12/5=3/5

以上です。

企業で統計を推進する立場にある者です。

どうしても微積の知識が必要になります。
ですから、途中の式を省略せずに書きます。

確率密度関数とは、横軸の何らかのスコアがどんな頻度で出現するかを表した関数です。
瞬間瞬間の出現確率を縦軸で表しています。
そして、その面積は1になっています。全体で100%であるから面積1なのです。
ちなみに、今の問題で面積を求めるために積分すると、
∫12(x^2-x^3)dx=12(1/3*x^3-1/4*x^4)=4x^3-3x^4
これに積分区間を代入して計算するとキチンと1になります。

さ...続きを読む

Q確率密度関数の期待値について

連続型確率密度関数xの確率密度関数f(x)がf(x)=0.5(1<=x<=3)。その他の範囲は0。
この時の期待値を求めよ。とあるのですが、

∮1~3 0.5x dx

という式になるのは理解できるのですが、なぜ答えが2になるのでしょうか。
詳しく解説して頂けると助かります。


この時、Y=exp(X)の確率密度関数を求めよ

Aベストアンサー

確率密度関数f(x)の期待値μ(簡単に言うと分布関数の平均値)は以下のように定義されます。

μ=∫(-∞→∞)xf(x)dx

この問題の場合

μ=∫(1→3)x(1/2)dx=2

です。

これは直感的にも1と3の真ん中と言うことと一致します。

Q幾何的ブラウン運動の遷移)確率密度関数の求め方

幾何的ブラウン運動
dX_t=u X_t dt + σX_t dW_t
X_0=x
の遷移確率密度関数が以下のようになる途中計算をできるだけ省略無く丁寧に教えてきださい。
p(t,x,y)= 1/(√2πσ^2 t) exp(-(log(Y/x)-ut)^2/(2σ^2 t))

宜しくお願いします

Aベストアンサー

確率微分方程式を解くと
X_t=x exp((u-σ^2/2)t+σW_t)
logX_t=logx +(u-σ^2/2)t+σW_t。
右辺がN(logx +(u-σ^2/2)t, σ^2t)に従うので対数正規分布の密度に当てはめて
P{X_t∈dy}
=(1/(y√(2πσ^2 t)))exp[-(log(y/x)-(u-σ^2/2)t)^2/(2σ^2t))]dy
かと思うのですが
質問の式と違うようですね…


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング

おすすめ情報