プロが教えるわが家の防犯対策術!

統計学に関する質問をさせていただきます。
N(μ1,σ1^2)の分布を持っているものと、N(μ2,σ2^2)の分布を持っているものを掛け算したとき、その結果はどのような分布になるのでしょうか?
具体的に申し上げます(カテゴリからちょっと外れてしまいますが)。とある電子回路の出力値が2つの部品の特性値の積で決定されるのですが、2つの部品のそれぞれの製造ばらつきが判明しているときに、出力値の分布が数式的にどのように表わすことがきるのかわからず悩んでいます。
同等の質問が既出でしたらごめんなさい。宜しくお願いいたします。

このQ&Aに関連する最新のQ&A

A 回答 (5件)

確率的に変動する互いに独立な2つの変数x1, x2の積。

一般には、かなりややこしい話になります。特にx1が(あるいはx2が)変動のために正になったり負になったりする、ということまで考慮すると。

 でも、製造ばらつきの話ですから、そんなに極端なばらつきは(多分)ないでしょう。もし、平均値μに比べて変動の幅σがうんと小さいのならば、ごく簡単な式で近似できます。

 p1, p2を、平均0、分散1の正規分布(標準正規分布)に従う、互いに独立な確率変数であるとして、
x1 = μ1 + σ1 p1
x2 = μ2 + σ2 p2
となっているものと考えます。以下は | σ1 / μ1 |<< 1であると仮定できる場合の話です。知りたいのは、x1x2がどうなるかですね。

 対数を取って
ln(x1) = ln ( (1+(σ1 / μ1)p1) + ln(μ1)
 ここで、ln(1+x)は|x|が小さい時
ln(1+x) ≒ x
であるから、仮定により、
ln ( (1+(σ1 / μ1)p1) ≒ (σ1 / μ1)p1
従って、
ln(x1) ≒ ln(μ1)+(σ1 / μ1)p1
です。なので
ln(x1x2)=ln(x1)+ln(x2) ≒ ln(μ1μ2)+q
ただしqは確率変数
q = (σ1 / μ1)p1+(σ2 / μ2)p2
です。
従って、対数を外すと
x1x2 ≒μ1μ2 exp(q)
ということになる。ところで |q|が小さいと仮定したのだから、
exp(q)≒1+q
であり、ゆえに
x1x2 ≒ μ1μ2 (1+q)

 さて、p1, p2は互いに独立で、どちらも標準正規分布に従うのだから、 qは平均0、分散 (σ1 / μ1)^2 + (σ2 / μ2)^2 の正規分布に従うことになります。
    • good
    • 1
この回答へのお礼

ご回答大変ありがとうございました。
丁寧な導出大変感謝します。一旦対数をとって、最後に外すというテクニックはすごいですね。
さて、
x1 = μ1 + σ1 p1
x2 = μ2 + σ2 p2
は、標準化したということですよね?
もし、もともとμ1=μ2=0つまり2つの部品の製造ばらつきのみから導出しようと試みた場合、もう少し簡単になりますでしょうか?その場合、最後の式
x1x2 ≒ μ1μ2 (1+q)
から求めることができますでしょうか?不勉強で申し訳ありませんが、宜しくお願いします。

お礼日時:2008/05/01 17:22

ANo.4のコメントについてです。



> つまりx1,x2のばらつきだけが分かれば、その積x1x2のばらつき(平均値に対する比)も算出できると理解しています。この考え方は正しいでしょうか?

「x1,x2のばらつき」と言うと、σ1、σ2のことになり、そりゃ駄目だとANo.2,3で回答しました。でもここで仰っているのは「(σ1/μ1)と(σ2/μ2)が分かっていればx1x2のばらつき(平均値に対する比)も算出できるんじゃないの?」という意味でしょうかね。それならば、YESです。

 (σ1/μ1)と(σ2/μ2)が分かっていれば、ANo.1のqの分散が計算できる。で、qは
x1x2 ≒ μ1μ2 (1+q)
という関係を満たす。つまり
x1x2 ≒ μ1μ2 +μ1μ2q
ということだから、x1x2の平均はμ1μ2 、分散は((μ1μ2)^2)((σ1/μ1)^2+(σ2/μ2)^2)である。つまり、x1x2の標準偏差は
|μ1μ2| √((σ1/μ1)^2+(σ2/μ2)^2)
であると分かります。

 なので結局、μ1, μ2 が未知であっても、(σ1/μ1)と(σ2/μ2)が分かっていて、しかも|σ1/μ1|と|σ2/μ2|がどちらも1より充分小さいのであれば、「x1x2の標準偏差が幾らかは分からないが、それはx1x2の平均の絶対値の √((σ1/μ1)^2+(σ2/μ2)^2)倍である」となら答えられる訳ですね。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。

>でもここで仰っているのは「(σ1/μ1)と(σ>2/μ2)が分かっていればx1x2のばらつき(平均値に対する比)も算出できるんじゃないの?」という意味でしょうかね。

その通りです。
私が申し上げたかったのはまさに最後の3行

>μ1, μ2 が未知であっても、(σ1/μ1)と(σ2/μ2)が分かっていて、しかも|σ1/μ1|と|σ2/μ2|がどちらも1より充分小さいのであれば、「x1x2の標準偏差が幾らかは分からないが、それはx1x2の平均の絶対値の √((σ1/μ1)^2+(σ2/μ2)^2)倍である」

のことでした。
最初のANo.1で既に答えは出ていたのに、何故気がつかなかったのだろうと、ふがいない思いです。すみませんでした。

このたびは長らくお付き合い頂きありがとうございました。これまでのご回答で私の悩みは全て解消しました。大変感謝しております。今後とも宜しくお願いします。

お礼日時:2008/05/04 23:47

 なんだかピンと来ない、という事かと思います。

ならば、こういうやりかたの方が(ちょっとおおざっぱだけど)却ってご理解戴けるかも。

 p1, p2を、平均0、分散1の正規分布(標準正規分布)に従う、互いに独立な確率変数であるとして、
x1 = μ1 + σ1 p1
x2 = μ2 + σ2 p2
とします。(つまり、x1は平均μ1分散σ1^2の正規分布に従う。x2も同様、ということです)すると、
x1x2 = (μ1 + σ1p1)(μ2 + σ2p2)
= μ1μ2 + μ2σ1p1 + μ1σ2p2 + σ1σ2p1p2

 ここで、もし右辺の最後の項 σ1σ2p1p2 が無視できたとすれば、
x1x2 ≒ μ1μ2+ (μ2σ1)p1 + (μ1σ2)p2
である。その場合、
r = (μ2σ1)p1 + (μ1σ2)p2
とおくと、rは平均0、分散(μ2σ1)^2 + (μ1σ2)^2の正規分布に従う。だから、x1x2は平均μ1μ2、分散(μ2σ1)^2 + (μ1σ2)^2の正規分布に従う。(なので、μ1、μ2が違えば、x1x2の分散も違うことが分かります。)

 では、σ1σ2p1p2 は無視できるのかどうか。
=============================
 それを検討するために、まず
X = x1x2/μ1μ2 -1
を考えると、
X = (x1x2-μ1μ2)/μ1μ2
= (μ2σ1p1 + μ1σ2p2 + σ1σ2p1p2 )/μ1μ2
= (σ1/μ1)p1 + (σ2/μ2)p2 + (σ1σ2/μ1μ2)p1p2
 ここで、
|σ1/μ1|<<1、|σ2/μ2|<<1
が成り立つ場合には、第3項の係数の絶対値は
|σ1σ2/μ1μ2| = |σ1/μ1||σ2/μ2|
 従って、
|σ1σ2/μ1μ2| << |σ1/μ1|
|σ1σ2/μ1μ2| << |σ2/μ2|
である。つまり、第1項、第2項に比べて第3項はうんと小さいのだから、
X ≒ (σ1/μ1)p1 + (σ2/μ2)p2
である。ゆえに、
x1x2 = (1+X)μ1μ2 ≒ μ1μ2+ (μ2σ1)p1 + (μ1σ2)p2
である。
=============================

 だから、|σ1/μ1|<<1、|σ2/μ2|<<1が共に成り立つ場合には、
x1x2 = μ1μ2 + μ2σ1p1 + μ1σ2p2 + σ1σ2p1p2
の右辺の最後の項 σ1σ2p1p2 は無視できる。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。
お察しの通り、こちら(ANo.4)の方が私にとってはすんなり頭に入りました。今回もそうですが、式の導出/証明には脱帽致します。
1つ前のお礼で申し上げた通りなのですが、もしσが平均値μの比率で表わされるのであれば、例えばσ1=0.1xμ1,σ2=0.1xμ2であれば、
x1x2 = μ1μ2 + μ2σ1p1 + μ1σ2p2 + σ1σ2p1p2
= μ1μ2 + 0.1μ1μ2p1+ 0.1μ1μ2p2 + σ1σ2p1p2
となり、とりあえず右辺第4項は無視できるとすれば、x1x2は平均μ1μ2、分散(0.1μ1μ2)^2+ (0.1μ1μ2)^2 = 0.02(μ1μ2)^2の正規分布に従う。つまりx1,x2のばらつきだけが分かれば、その積x1x2のばらつき(平均値に対する比)も算出できると理解しています。この考え方は正しいでしょうか?宜しくお願いします。

お礼日時:2008/05/03 23:48

ANo.2のコメントについてです。



 まず[2]について、 「幾つかの例」の作り方は簡単です。
たとえばσ1=σ2=1 だとします。
(a) μ1=10, μ2=1000の場合、ANo.1の近似によって、qの分散は
(σ1/μ1)^2 + (σ2/μ2)^2 = (1/10)^2+(1/1000)^2 ≒1/100
ぐらいであり、従ってx1x2の分散は
((μ1μ2)^2)×(1/100) = ((10×1000)^2)×(1/100) = 1000000
ぐらいです。
(b) μ1=μ2=100の場合、ANo.1の近似によって、qの分散は
(σ1/μ1)^2 + (σ2/μ2)^2 = (1/100)^2+(1/100)^2 =2/10000
ぐらいであり、従ってx1x2の分散は
((μ1μ2)^2)×(2/10000)= ((100×100)^2)×(2/10000) = 20000
ぐらいです。
 つまり、σ1, σ2が同じでも、μ1, μ2によってx1x2の分散はまるっきり違う。(Excelか何かで、実際に乱数を使って試してみては如何でしょうか。)

 次に[1]です。ANo.1の近似は「x1, x2のどちらについても、|μ|に比べてσがうんと小さい」という仮定のもとで導きました。このときはx1x2はほぼ正規分布になってくれる。ここで|μ|をだんだん小さくして行くと、「|μ|に比べてσがうんと小さい」とは言えない状況になってきて、x1x2の分布が正規分布から外れてきます。
 例えば、x1とx2が標準正規分布に従う場合(μ1=μ2=0, σ1=σ2=1)、掛け算の性質により、
|x1|<1の場合には|x1x2|<|x2|
|x1|>1の場合には|x1x2|>|x2|
になる。つまり、|x1x2|は|x2|より小さくなるか、あるいは|x2|より大きくなるかのどっちかになって、|x2|とほぼ同じということは滅多に起こらない。
 このために、x1x2の分布はx2の分布(標準正規分布)に比べてより広がった裾野と、よりとんがったピークを持つ分布になります。これも、Excel等で試してご覧になればご納得いただけるかと。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
早速EXCELで試してみました。一目瞭然でした。
当初不思議に思っていたのですが、ここでようやく私自身大きな勘違いをしていることに気がつきました。それは、ばらつき(σ)が絶対値(平均値からの差)を表わしているのであって、相対値(平均値からの比率)ではないということです。これに気がついた瞬間、ANo.3や今までのモヤモヤがなくなりました。ありがとうございました。

お礼日時:2008/05/03 22:27

ANo.1のコメントについてです。


 話がよく見えませんけど…

[1] もし本当にμ1=μ2=0であるということですと、ANo.1は全く使い物になりません。その場合は、x1x2の分布は正規分布とはだいぶ違うものになり、結構面倒な計算になりますよ?

[2] もし、μ1とμ2が未知の状態で、σ1とσ2だけ与えてx1x2の分散を知りたい、という話であるなら、それは絶対無理です。(幾つか例を考えればお分かりになるでしょう)
    • good
    • 0
この回答へのお礼

早急なご回答ありがとうございました。
μ1=μ2=0としてしまうことで変数が減ったら、もう少し簡単に表現できるのかなと思ったのと、ばらつきだけ分かればその積のばらつきも表現できるのかなと思ったので、再度質問させて頂いた次第です。
貴殿のコメントについて教えてください。
[1] 計算が面等になるというのはともかく、μ1=μ2=0になると何故x1x2の分布は正規分布とはだいぶ違うものになってしまうのですか?平均値がシフトしただけで分布の仕方が大きく異なってくることがイメージできません。
[2]上記の通り、σ1とσ2だけ与えられればx1x2の分散が分かるのではないかと漠然と思っていました(もちろんx1x2の平均は絶対求められないのは理解しています)。ですので、貴殿が絶対無理と言われる理由が分かりません(幾つかの例がでてきません...)。
基本が理解できていないから私はこんな質問をしてしまうのでしょう。申し訳ありません。もう少しお付き合い頂けると幸いです。宜しくお願いします。

お礼日時:2008/05/01 22:48

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q2つの正規分布を合成したらどうなるのでしょうか?

現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。
どうかご教授よろしくおねがいします。


平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが



例えば互いに独立で

国語の平均点、分散を(μ1,σ1)としての正規分布f(国語)
数学の平均点、分散を(μ2,σ2)としての正規分布f(数学)

とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか?

もしμ3=μ1+μ2,σ3=σ1+σ2のように平均も分散も和で考えてよいのなら

f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2}

が答えだと思っているのですが、それとは別のやり方で



f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と
f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。

しかし、僕の数学の知識ではこれができなくて困っています。ガウス積分の公式を使ったりしなければいけないのではないかとも考えいるのですが行き詰っています。

アドバイスよろしくお願いいたします。

現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。
どうかご教授よろしくおねがいします。


平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが



例えば互いに独立で

国語の平均点、分散を(μ1,σ1)としての正規分布f(国語)
数学の平均点、分散を(μ2,σ2)としての正規分布f(数学)

とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか?

...続きを読む

Aベストアンサー

> 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが
一般的には分散をσ^2と表し、標準偏差はその平方根でσと表します。
質問者さんが示された確率密度関数は、平均 μ、分散 「σ^2 」の正規分布のものです。分散と標準偏差の扱いをもう少しきちんとしましょう。

> μ3=μ1+μ2, σ3=σ1+σ2のように平均も分散も和で考えてよいのなら
2つの確率変数 X, Y があり、それぞれの平均と「分散」がμ1, (σ1)^2, μ2, (σ2)^2 であるとします。確率変数 Z を Z = X + Y で定め、Z の平均と「分散」をμ3, (σ3)^2 とすると・・・

μ3 = μ1 + μ2
は、X, Y がどのような分布であっても(X, Y が異なる分布であっても)成立しますし、X, Y が互いに独立であるか否かに関わらず成立します。
また、X, Y が互いに独立であれば(それらの分布によらず)、
(σ3)^2 = (σ1)^2 + (σ2)^2
が成立します。(このとき Z = X + Y の「標準偏差」σ3 は、σ3 = √( (σ1)^2 + (σ2)^2 ) )

> f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2}
> が答えだと思っているのですが
X, Y が互いに独立な確率変数であり、共に正規分布に従うならば、X + Y もまた正規分布に従うという事実は確かにありますが、これは正規分布の「再生性」と呼ばれる特別な性質であることを理解していなければなりません。その点、大丈夫ですか?

> それとは別のやり方で
> f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と
> f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。
上述したように、正規分布の再生性を示す必要があるならば、畳み込み積分でそれを示すのが一法なのであって、何も「別のやり方」ではありません。
案ずるより計算するが易しです。式の整理が面倒なだけで、特別な知識は不要です。
f(x) = 1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}
g(x) = 1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}
h(x) = ∫f(t) g(x - t) dt
  = 1/(2πσ1 σ2) ∫exp{ - (t - μ1)^2 / (2σ1^2) - (x - t - μ2)^2 / (2σ2^2) } dt
  epx( ) の指数部を t で平方完成して
  = 1/(2πσ1 σ2) ∫exp{ - (t - 何ちゃら )^2 / (2σ1^2 σ2^2 / (σ1^2 + σ2^2)) - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) } dt
  = 1/(2πσ1 σ2) exp{ - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) } ∫exp{ - (t - 何ちゃら )^2 / (2σ1^2 σ2^2 / (σ1^2 + σ2^2))} dt
  = 1/√(2π(σ1^2 + σ2^2)) exp{ - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) }
  (∵ ∫ exp ( - (t - A)^2 / 2B^2 ) dt = √(2π) B )
μ3 = μ1 + μ2, σ3^2 = σ1^2 + σ2^2 とおけば
h(x) = 1/(√(2π) σ3) exp( - (x - μ3)^2 / 2 σ3^2 )
途中、「何ちゃら」の部分は省略してますので、興味があれば追っかけてみてください。

なお、本件は確率論において、ごくごく基本的な事項です。
もし、これから確率統計を使って研究をされるのならば、このような件を簡単に質問して済ませるのは危うい感じがします。ちゃんと書籍を読まれ、その上で質問されるのが宜しいでしょう。

> 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが
一般的には分散をσ^2と表し、標準偏差はその平方根でσと表します。
質問者さんが示された確率密度関数は、平均 μ、分散 「σ^2 」の正規分布のものです。分散と標準偏差の扱いをもう少しきちんとしましょう。

> μ3=μ1+μ2, σ3=σ1+σ2のように平均も分散も和で考えてよいのなら
2つの確率変数 X, Y があり、それぞれの平均と「分散」がμ1, (σ1)^2, μ2, (σ2)^2 であるとします。確率変数 Z を Z = X + Y で定め、Z ...続きを読む

Q±4σに入る確率について教えてください

ウィキペディアの検索より、
確率変数XがN( μ, σ2)に従う時、平均 μ からのずれがσ以下の範囲にXが含まれる確率は68.26%、2σ以下だと95.44%、さらに3σだと99.74%となる。
と分かりました。

そこで
4σ、


の場合確率はどうなるか教えてください。
よろしくお願い致します。

Aベストアンサー

Excel で NORMDIST を使い、平均 50、標準偏差 10 (いわゆる偏差値)で計算してみましたら、次のようになりました。

 σ 0.682689492137086
2σ 0.954499736103641
3σ 0.997300203936740
4σ 0.999936657516326
5σ 0.999999426696856
6σ 0.999999998026825
7σ 0.999999999997440
8σ 0.999999999999999
9σ 1.000000000000000

Excelの関数の精度がどの程度のものか分かりませんが、9σで100%になりました。

Q正規分布の加法性について

すいません。統計学初学者です。
正規分布の加法性でわからないことがございます。

1.N(u1, σ1^2) + N(u2, σ2^2) → N(u1 + u2, σ1^2+σ2^2)
2.N(u1, σ1^2) - N(u2, σ2^2) → N(u1 - u2, σ1^2+σ2^2)

正規分布を足しても引いても、
平均はそれぞれ、足されるあるいは引かれますが、
なぜ、分散だけはどちらも足されるのでしょうか?
分散は引くことは出来ないものなのでしょうか?

よろしくお願いいたします。

Aベストアンサー

>分散を引いたときと足したとき、分散の値は同じ。

根本的な誤解があります。質問者さんが参考にしている本も私たちも分散の引き算を、
さらには分布の引き算を論じているわけではありません。2つの確率変数X,Yの和、差の
結果として(X-Y)の分布、分散がどうなるかを論じています。この二つは全く違う議論です。

確率変数は何らかの分布に従ってはいても実態は具体的な数字です。
サイコロの出目であったり、#3で例としてあげたコインの枚数であったり、
工場で作れらる製品の不良品の数であったり様々ですがあくまでただの数字であり、
分布では有りません。ただ、その出現頻度が何らかの法則に従っているだけです。
この具体的な数字、例えば大きなサイコロと小さなサイコロを振って大きいサイコロの
出目から小さいサイコロの出目を引くといったことを考えるのが確率変数の引き算で、
その結果がどのような分布に従うことになるかを今、論じているのです。

さらに分かり易い(?)例を考えてみると、A社の200g入り牛乳の実重量が正規分布(203,1)に
従っているとします。ここから2本ずつ取り出してそれぞれの重量の差を求めてみます。
その結果が(0,0)、つまり全部0、どれも差がなかったことになると思いますか?
重いものから軽いものを引くこともあるし、軽いものから重いものを引くこともあり
結果として差は正規分布(0,2)に従うことになりますよ、と言っているのが参考書ですし、
回答者みなさんなのです。

もちろん、分散を引く計算を問題にすることも出来ます。
重量が正規分布に従うコップが有ってここに重量が正規分布(100,5)に従う水を
入れたら全体の重さは正規分布(120,8)に従った。元のコップの分布を求めよ。
これなら分散を引いて答えは(20,3)になります。しかしこれは確率変数の差を
求めているわけではないのですよ。

>分散を引いたときと足したとき、分散の値は同じ。

根本的な誤解があります。質問者さんが参考にしている本も私たちも分散の引き算を、
さらには分布の引き算を論じているわけではありません。2つの確率変数X,Yの和、差の
結果として(X-Y)の分布、分散がどうなるかを論じています。この二つは全く違う議論です。

確率変数は何らかの分布に従ってはいても実態は具体的な数字です。
サイコロの出目であったり、#3で例としてあげたコインの枚数であったり、
工場で作れらる製品の不良品の数であったり様々...続きを読む

Q誤差を含む数値同士を掛け算した時の誤差

誤差を含む数値を足し算した時の誤差については、ここで「集積誤差」とか「累積誤差」とかをを調べて理解したのですが、掛け算の場合はどう考えたら宜しいのでしょうか?

例えば、ある液体を「a±h 倍」に希釈したサンプルの濃度を測定したら「b±i g/L」であった。原液の全量が「c±j L」あるとき、全体に含まれている物質の量を「d±k g」と表わすと、当然 d=a×b×c ですが、誤差の部分 ±k を計算するには、どうしたら良いでしょうか?

なお、このカテゴリーへは初めての書き込みです。不備がありましたら御指摘下さい。

Aベストアンサー

一般にある量fがx1,x2,x3,・・・という量と

f=f(x1,x2,x3,・・・・)=x1^p1 x2^p2 x3^p3・・・・=Πi xi^pi

の関係にあるとき、xiの誤差をΔi, fの誤差をΔf、平均を<・>で表すとして

Δf/|<f>|=√[ Σi pi^2 (Δi/<xi>)^2]

の関係があります。(誤差の伝搬(伝播)の法則)

したがってこの問題の場合は

k = |d| √[(h/a)^2+(i/b)^2+(j/c)~2]

となります。

Q確率密度関数の四則演算

http://oshiete.goo.ne.jp/qa/8571563.html

このページで二つの独立した確率密度関数の
足し算と掛け算の確率密度関数に関してご回答いただいたのですが

x + y の確率密度関数が二等辺三角形

x × y の確率密度関数が-ln(t)

になるのはどういう計算を行っているのでしょうか?

検索しても調べてみたのですが
解説ページが見つかりませんでした。
解説ページなどあれば教えてください。

Aベストアンサー

かのご質問ではコタエばかりが求められており、かつ、あんまり適切な回答がないようなので、結果だけをカキコしたのでしたが、こりゃ、セキニンとらんといかんですかね。

 正規分布を日常的に使っているくせに、意味がよく分かってない人がちょいちょいいます。「平均0、分散1の正規分布に従う確率変数pがp=0となる確率P(0)は?」と尋ねてみると分かってるかどうかがテストできます。P(0)=0と正しく答えられるかどうか。
 もし、あれれ? となる場合には[1]から、そんなの分かってると仰るのなら[2]からどうぞ。

[1] 「確率変数xが確率密度関数φ(x)に従う」とは、Δaがうんと小さい正の実数のとき、mΔa≦x<(m+1)Δa(すなわちx∈[mΔa,(m+1)Δa))となる確率をP(x∈[mΔa,(m+1)Δa))と書くと
  lim[Δa→0] P(x∈[mΔa,(m+1)Δa))= φ(mΔa)Δa
だってことです。特にxが一様分布φ1(x)に従うのであれば、
  lim[Δa→0] P(x∈[mΔa,(m+1)Δa))= φ1(mΔa)Δa
である。
 さて、x∈[mΔa,(m+1)Δa)であるとします。このとき、z=x+yの分布はどうなるか。ただしyがφ1(y)に従い、しかもyはxとは独立である。簡単ですね。y=z-aなのだから、もちろんzは φ1(z-mΔa)に従う。
 言い換えれば、x∈[mΔa,(m+1)Δa)であって、Δbがうんと小さい正の実数のとき、nΔb≦z<(n+1)Δbとなる条件付き確率は
  P(z∈[nΔb,(n+1)Δb) | x∈[mΔa,(m+1)Δa)) = φ1(nΔb-mΔa)Δb
です。だからz∈[nΔb,(n+1)Δb)となる確率は
  P(z∈[nΔb,(n+1)Δb)) = lim [Δa→0] Σ{n=-∞〜∞} P(z∈[nΔb,(n+1)Δb) | x∈[mΔa,(m+1)Δa)) P(x∈[nΔa,(n+1)Δa))
   = lim [Δa→0] Σ{n=-∞〜∞} φ1(nΔb-mΔa)Δb φ1(nΔa)Δa
   = ∫{a=-∞〜∞} φ1(nΔb-a)Δbφ1(a) da
と書ける。zが従う確率密度関数をφa(z)とすると、
  lim[Δb→0] P(z∈[nΔb,(n+1)Δb)) = φa(nΔb)Δb
なので、
  lim[Δb→0] (φa(nΔb) - P(z∈[nΔb,(n+1)Δb))/Δb )= 0
つまり
  φa(b) - ∫{a=-∞〜∞} φ1(b-a)φ1(a) da
ここでbをz, aをxに書き換えてみると
  φa(z) = ∫{x=-∞〜∞} φ1(z-x)φ1(x) dx
となります。

[2] 一般に、
   (f*g)(z) = ∫{x=-∞〜∞} f(z-x)g(x) dx
を 「fとgの畳み込み(convolution)」と呼びます。
 なお、(f*g) = (g*f) が成り立つことは容易に証明できます。畳み込みは信号処理・画像処理における「フィルター」、制御工学における「伝達関数」の作用を表すのにも使われる、とても重要な概念です。
 これを使って、

定理:「確率密度関数f(x)に従うxと、xとは独立で確率密度関数g(y)に従うyについて、z=x+yは確率密度関数(f*g)(z)に従う」
 (これは、上記[1]の計算をfとgを使ってやり直してみれば証明できるでしょ。)

[3] では、確率密度関数f(x)に従うxと、xとは独立で確率密度関数g(y)に従うyについて、t=xyはどんな確率密度関数に従うか。
 t=xyの両辺の対数をとって
  ln(t) = ln(x) + ln(y)
とし、ln(t), ln(x), ln(y)をそれぞれ T, X, Yという確率密度関数だと考えれば、「確率密度関数f(X)に従うXと、Xとは独立で確率密度関数g(Y)に従うYについて、T=X+Yは確率密度関数(f*g)(T)に従う」わけです。
 xがφ1(x)に従うとき、X = ln(x)がどんな確率密度関数fに従うか。これは簡単でしょうからご自分で。Tが従う確率密度関数は(f*f)(T)です。あとは t = exp(T) がどんな確率密度関数に従うか、という問題を解けば、おしまいです。

 「分かりやすい」をお求めですけど、すらすら行かない場合でも、少なくとも2〜3日ぐらいは粘ってみて下さいな。七転八倒することが地力を付けること。こんなの慣れちまえば鎧袖一触です。

かのご質問ではコタエばかりが求められており、かつ、あんまり適切な回答がないようなので、結果だけをカキコしたのでしたが、こりゃ、セキニンとらんといかんですかね。

 正規分布を日常的に使っているくせに、意味がよく分かってない人がちょいちょいいます。「平均0、分散1の正規分布に従う確率変数pがp=0となる確率P(0)は?」と尋ねてみると分かってるかどうかがテストできます。P(0)=0と正しく答えられるかどうか。
 もし、あれれ? となる場合には[1]から、そんなの分かってると仰るのなら[2]からどうぞ。...続きを読む

Q標準偏差同士の計算はどうやるのですか?

例えば、
(6±0.2)÷(3±0.1)=
を計算すると、
答えが、5.8/3から16.2/2.9となるとおもうのですが。
もっとふくざつな四則計算になると歯が立ちません。

このような計算を簡潔に解ける方法はあるのでしょうか?

また、Mathematicaで解くことは出来ますか?

Aベストアンサー

±をどういう意味だと思うかによって、話が違います。

[1] ご質問は「標準偏差同士の計算」となっていますから、±の後ろにある数値は標準偏差のお積もりでしょうかね。だとすると、
> (6±0.2)÷(3±0.1)=
> を計算すると、
> 答えが、5.8/3から16.2/2.9となる
 そうとは限らないです。たとえば分子と分母がそれぞれ正規分布に従う場合を考えると、分子も分母も(僅かな確率ですが)平均値からうんとかけ離れた値を取りうる。だから、取りうる値の範囲(最大・最小)は幾らでも大きくなります。じゃあ割り算した結果の(範囲ではなくて)標準偏差は幾らか、ということが気になる訳ですが、それは分子がどんな分布に従っているか、分母がどんな分布に従っているか、分子と分母が相関を持つかどうか、また、分母が0以下になる確率が0かどうかでも話が違ってきます。だから、標準偏差だけでは情報不足で答が出ません。

[2] しかし (ご質問のタイトルとは違って)もし±の後ろにある数値が範囲を表している(つまり、6±0.2なら最大6.2, 最小5.8という意味)ならば、
「6-0.2≦x≦6+0.2, 3-0.1≦y≦3+0.1のとき、x ÷ y の範囲を求める」
という形の問題だと考えれば、答の範囲が決められます。もっと複雑な演算でも同じことですね。

[3] ところで、もし±の後ろにある数値が、有限の桁数で数値計算をする際に生じる誤差の見積もりを表している(つまり、6±0.2なら0.2程度の誤差が含まれているという意味)なら、もうちょっと別のアプローチもあります。
 もちろん、±の後ろに付いているのが範囲を表していると思えば上記[2]の話と同じことですけれども、そのやり方ではあまりに悲観的すぎる。計算を繰り返して行くと、±の後ろの部分がどんどん大きくなってしまう。
 でも実際には、計算のたびに生じる誤差同士が互いに打ち消し合う効果があるために、答の誤差はそんなには大きくならない。この事を考慮した実用的な誤差の見積もり方として、「精度保証付き数値計算」と呼ばれる工学理論があります。

±をどういう意味だと思うかによって、話が違います。

[1] ご質問は「標準偏差同士の計算」となっていますから、±の後ろにある数値は標準偏差のお積もりでしょうかね。だとすると、
> (6±0.2)÷(3±0.1)=
> を計算すると、
> 答えが、5.8/3から16.2/2.9となる
 そうとは限らないです。たとえば分子と分母がそれぞれ正規分布に従う場合を考えると、分子も分母も(僅かな確率ですが)平均値からうんとかけ離れた値を取りうる。だから、取りうる値の範囲(最大・最小)は幾らでも大きくなります。じゃあ割...続きを読む

Q誤差の割り算?

物理の課題で誤差のある直径と誤差のある高さ、誤差のある重さを使って円柱の密度を求める問題が出されました。
直径、高さは平均値とその確立誤差を求めてそれぞれ5.42±0.01cm、9.76±0.01cmと出ました。
その後体積は225±1立方cmと求めたのですがそれを1784.3±0.1gという重さから割る動作が分かりません。
何か特別な方法でもあるのでしょうか。
やり方だけでもいいのでアドバイスを頂けないでしょうか?
どうか宜しくお願いします。

Aベストアンサー

こんにちは。大学生レベルとして回答しますね。
密度d,体積v,質量mとすれば,その誤差は,

Δd=∂d/∂v・Δv + ∂d/∂w・Δw

でよいのでは?vはさらに半径rと高さhで書き下す必要がありますが,ご質問から察するにそこはもう終わっている,ということですよね?(私は計算していないので,結果の正誤のほどは分かりませんが)
かなり不親切な回答ですが,これで考えてみてくださいね(^^

*おかしいとお気づきの方がいらっしゃいましたら,ぜひ補足ください。

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q正規分布に従わないと標準偏差の算出は向かないでしょうか?

正規分布に従うとは、平均値の分布が多いという意味でしょうか?

日々変わるデータの点数が凸のような分布でなく、平均値付近が少ない
凹のようなデータの集合だと、標準偏差を算出し正規分布を使い
30%以下の人や70%以上の人を毎日抽出するような用途には
向かないのでしょうか?

Aベストアンサー

まず、正規分布に従うとは、「分布が正規分布のグラフと同じ形をする事」をいいます。
そのため、平均辺りが多くても△のような分布グラフだったり、
左右が対象でないと、「正規分布に従う」とは言いません。

そのため、試験の成績などは、「正規分布に近い」だけであって、
「正規分布に従っている」のではありません。

つまり、「偏差値」を使うべきかどうかは、偏差値の「分かりやすさ」と、
その分布が正規分布に近いかどうかの判断になります。



例えば、凹のようなデータでも、両端がなだらかになっていれば、そこそこ偏差値も使えます。

逆に、両端が崖のようになっていると、偏差値を使うのは控えた方がいいでしょう。
(たとえば、30点や、80点の人は多いけど、29点以下や、81点以上がいないなど)

また、分布が左右対称でない場合も、使用をやめた方がいいでしょう。
平均値と、中央値(順位が真ん中の人の値)が離れると、偏差値の感覚的な値とは
ずれてきます。



いずれにしても、ある程度のデータがあるのであれば、そのデータで
やってみるのが一番です。

出るべき結果と大きなずれがなければ、分かりやすいので使ってしまっても
いいのではないでしょうか。

試験の結果なんかでも、山が二つあったり、左右に偏っている事なんて
よくあります。

それでも、偏差値が、それなりに機能していますから、まずはやってみるのが
いいのではないかと思います。

まず、正規分布に従うとは、「分布が正規分布のグラフと同じ形をする事」をいいます。
そのため、平均辺りが多くても△のような分布グラフだったり、
左右が対象でないと、「正規分布に従う」とは言いません。

そのため、試験の成績などは、「正規分布に近い」だけであって、
「正規分布に従っている」のではありません。

つまり、「偏差値」を使うべきかどうかは、偏差値の「分かりやすさ」と、
その分布が正規分布に近いかどうかの判断になります。



例えば、凹のようなデータでも、両端がなだら...続きを読む

Qカイ2乗検定って何??;;

タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

Aベストアンサー

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.

例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.

さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40

当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40
(3)ズレ    +32   -17   -14   + 9
(4)ズレ二乗 1024   289   196   81
(5)(4)÷(2) 25.6  7.225  4.9  2.025

 χ2=25.6+7.225+4.9+2.025=49.25

計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.

さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.

以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.

χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.

質問者さんの場合は

> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、

これを理論値としてうまく設定することが鍵となるでしょう.

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布...続きを読む


人気Q&Aランキング