プロが教える店舗&オフィスのセキュリティ対策術

正規分布の和について教えて頂けませんか?
あるサイトを見たら、2つの正規分布の和の新しい平均はμ1+μ2だと解説しています。
これは間違いでしょうか?正しいでしょうか?
A組の数学の平均が70点(100点満点)で、B組が90点(同じテスト)の場合、A+B組の数学の平均は70+90となります・・・・そんなはずはありません!しかし他のサイトにも同じ解説がありました。
これは(μ1+μ2)/2の間違いではないでしょうか???
よろしくお願いします。

質問者からの補足コメント

  • 分散も、(σ1の2乗+σ2の2乗)になると解説してあります。何度検算してもそうならないのは、この式が正しくないからではないでしょうか?(σ1の2乗+σ2の2乗)は本当は正しくはどうなるのでしょうか?よろしくお願いします。

    No.2の回答に寄せられた補足コメントです。 補足日時:2019/01/20 21:38
  • 分散については、
    Aグループ:(1,2,3)は、平均=2、分散=1
    Bグループ:(2,3,4)は、平均3、分散=1とすると、
    A+Bグループ:1,2,2,3,3,4は、平均2.5、分散は計算すると、約0.9でした。
    平均は(μ1+μ2)/2=2.5で、理解できます。
    しかし分散は決して1+1=2ではありません…巷の解説のどこが間違っているのでしょうか?

      補足日時:2019/01/21 09:43
  • まだ質問が正しく理解されていないので、再度整理します。
    ①2つの正規分布の和の新しい平均はμ1+μ2と解説されていますが、実際は、そうならない。
    例:A組の数学の平均80点、B組の数学の平均90点のときA+B組の平均は170点?
    ②2つの正規分布の和の新しい平均はσ1+σ2と解説されていますが、実際は、そうならない。
    これらの理由を、解説できる方のみの回答をお願いいたします。

      補足日時:2019/01/23 09:04

A 回答 (13件中1~10件)

ANo.12に付けられたコメントについてです。



> 現実世界で実際にこのように足して新しい分散を考えるときはどのような時

 たとえば「アボカドの種と、手作り植木鉢をひとつづつ袋に入れたセットを作った。種の質量の分布と植木鉢の質量の分布がわかっているとき、袋には種と鉢をランダムに投入したとすると、袋の質量の分布は?」

 種と鉢とが独立にサンプリングされている場合、袋の質量の確率密度関数φは、種の質量の確率密度関数sと鉢の質量の確率密度関数hの「畳み込み積分(convolution)φ=s*h 」で計算できます。しかし、平均や分散を知りたいだけなら、sとhの平均と分散だけわかっていれば良く、畳み込み積分は必要ない。(もちろん、どうしてそんな公式が成り立つのかを証明するには、畳み込み積分を使うんです。)

 統計学で最も重要な応用をひとつ挙げれば、「平均μ、標準偏差σを持つある分布からランダムに10個のサンプルx[1],x[2],…,x[10]を取って、その平均値mを計算する。mはどんな分布に従うか。」
 (「平均値m」なんて言葉でうっかりわかった気にならないで)mってどうやって計算するのかを考えれば、
   m = (1/10)x[1] + (1/10)x[2] + … + (1/10)x[10]
です。(重み付きの)足し算で計算したものmの分布を考えているわけですから、mが従う分布の平均と分散はご覧のサイトに書いてあるであろう公式を使って計算できますね。
    • good
    • 1
この回答へのお礼

[種と植木鉢]の例は分かりやすいです。確かにμ1+μ2ですね。これを割ったら変です・・・。
分散もそのまま足せばいいですね。
[ひとずつランダムに選んで新しいサンプルを作る]ときに便利そうです。例えば、センター試験に例えると、各学校の各教科の受験生からランダムに1サンプルを抽出して5教科の新しいサンプルを作る。それを学校別に比較するとか。
勝手な想像ですが、製品を作るとき(例:車)、各部品の平均の重さを足した分布が、その製品の平均の重さの分布になるのではないかと思います。
とにかく「全部足すのではない」ということが分かりました。
超素晴らしい解説ありがとうございます。いろいろサイトを見ましたが数式上の足し算だけが書いてあり、「ランダムにひとつ選んで新しいサンプル」について書いてある解説は発見できませんでした…。この件は理解できていない人も多いのではないかと思います。一つ理解が進みました。ひょっとして統計学の先生ですか?またよろしくお願いします。

お礼日時:2019/01/25 11:20

> 2つの正規分布の和の新しい平均はμ1+μ2



ここでいう「正規分布の和」というのは、

> A+B組

という「二つの集合の和集合」の話をしているんじゃありません。そうではなくて、

「A組からひとり、B組からひとりをそれぞれランダムに選んだときの、その二人の数学の得点の和」の分布を考える

ということです。(ここを勘違いして悩む人は結構多いのです。正しく理解しているから悩まないという人は少数。圧倒的多数の人は能天気に丸暗記するだけだから、当然悩まない。)

 もちろん「2つの正規分布の和」だなんて曖昧な文言を書いたヤツに罪がある。キチンと正確に「ある分布pに従うサンプルxと、別の分布qに従い、かつxとは独立したサンプルyとの和 x+yの分布r」と言えば、誤解は生じない。(ちなみに、rの平均値はpの平均値とqの平均値の和になります。p,q,rが正規分布であるかどうかは関係ありません。)
    • good
    • 1
この回答へのお礼

ありがとうございます!「ひとつずつランダムに選んで和の分布を考える」ですね。
ということは、例えば、
120と130=250
110と125=235
100と140=240
という具合に「和の分布」ですね。
これがどのような分布をするかですね。
そうですか!少し分かってきました。であれば、100点満点とか200点満点とかは関係ないですね。
素晴らしい解説です。まだ100%クリアではありませんが、じっくり考えてみます。
一つお伺いします。統計学は実学ですが、現実世界で実際にこのように足して新しい分散を考えるときはどのような時でしょうか?つまり、分布の和を考えることがどのようなことに役立つのでしょうか?

お礼日時:2019/01/24 15:34

お礼を拝見しました。



あなたが話されている内容は「正規分布の和」ではなく、「標本平均」です。

もちろん全国のセンター試験の数学の平均は、1,200,000点になるはずがありません。「正規分布の和」の話ではなく、むしろ「標本平均」の話だからです。

一度、標本平均について調べてみてください。
    • good
    • 1
この回答へのお礼

知りたいのは「正規分布の和」です。そのときの新しい分布の平均と分散です。平均がμ1+μ2・・・だと定義すると、平均が1,200,000もあり得ます。変です。やはりμ1+μ2ではありませんね。新しい分布の平均と分散は正しくはどう理解するのでしょうか?

お礼日時:2019/01/23 19:57

まず平均の和μ1+μ2から。



>①2つの正規分布の和の新しい平均はμ1+μ2と解説されていますが、実際は、そうならない。

例:A組の数学の平均80点、B組の数学の平均90点のときA+B組の平均は170点?

説明しやすいように、1年のクラスが1年A組、1年B組と2つのクラスがあるとしよう。そしてクラスの人数も両方3人にしよう。A組にはA1、A2、A3の3人、B組にはB1、B2、B3の3人がいると仮定します。A組の平均点は80点、B組の平均点は70点とします。

あなたが言いたいのは、「正規分布の和は平均を足し合わせているが、これだと1年全体の平均にはならないのでは?」ということですよね。もちろん、1年全体の平均点は私の設定した通りだと75点です。ただし、「正規分布の和のμ1+μ2」は「1学年全体の平均」を出しているわけではありません。そこを勘違いされているようです。

正規分布の和で平均の和も取るというのは、「1学年全体の平均点」を表すのではなく、簡単に言えば「A組の人とB組の人を1人ずつピックアップして和を取った時の平均」ということです。

A1=75点、A2=80点、A3=85点、B1=60点、B2=70点、B3=80点とします。(Aクラスの平均:80点、Bクラスの平均:70点)

もちろん、これを1学年6人のグループとすれば、平均は75点になりますよ。

しかし、「正規分布の和で足し合わせた平均」というのは

①A1+B1=135
②A1+B2=145
③A1+B3=155
④A2+B1=140
⑤A2+B2=150
⑥A2+B3=160
⑦A3+B1=145
⑧A3+B2=155
⑨A3+B3=165

要するにA組とB組から1人ずつ取って2人の点数を合計した値の平均のことを言っています。

①~⑨の平均を取ると150点になりませんか?A組の平均点とB組の平均点を足し合わせた和になりませんか?
    • good
    • 1
この回答へのお礼

詳しい解説ありがとうございます。なるほどです。
もし、ある高校のセンター試験の数学の平均が120点だとします。
高校が全国に10,000校あるとします。
計算をしやすくするために、その10,000校のそれぞれの平均が全て120点だったとします。
とすると、全国のセンター試験の数学の平均は1,200,000点となるのでしょうか?
やはり足すのは極めて変です。それを人数で割って平均がでるのではないでしょうか?

お礼日時:2019/01/23 18:17

No.2/3/4/5 です。

まだ理解できていないようですね。

「統計学」には、大きく分けて「記述統計」と「推測統計」というものがあります。
↓ 例えば、こんな説明
http://hs-www.hyogo-dai.ac.jp/~kawano/HStat/?200 …
https://toukeigaku-jouhou.info/2018/02/27/descri …

質問者さんが例に出されているのは、いずれも「記述統計」の話です。具体的な「サンプル」そのものの値です。

ところが、質問で問うている「正規分布の和」は「推測統計」の話です。これは「サンプル」から「母集団を推定する」というもので、「平均」や「分散」は「サンプル」そのもののものではなく「母集団」のものを指しています。

この2つをきちんと区別してくださいね、と再三言っているのです。

「正規分布の和」の例題としては、たとえば
・あるメーカーでは、「2段はしご」を製品として売っている。
・それは、部品Aと部品Bをつなぎ合わせて製品としたものである。
・部品Aは「長さの平均が μ1、分散が σ1^2」、部品Bは「長さの平均が μ2、分散が σ2^2」で生産されている。
・では、製品の「2段はしご」の長さの平均、分散はどうなっていると推定できるか。
というものです。
あるいは
・製品を購入したとき、その長さは信頼度95%でどの範囲にあると推定できるか。
・購入した製品の長さが「L メートル」であったとき、それは「不良品」と言えるか。
というような問題に対応することです。
このときに、「製品の長さの分布」が「平均:μ1 + μ2」「分散:σ1^2 + σ2^2」になると「推測できる」のです。


質問者さんが「推測統計」の話をしているということは、おそらく大学生以上なのかと思いますが(高校まででは「記述統計」しかやらない)、だったらきちんと専門書をひも解いて、ご自分の疑問を「学問的に」解決することをお勧めします。
    • good
    • 1

誤記に気づきました。

訂正します。
[誤] 1,2,3なら,=約1.3 かな? 
[正] 1,2,3なら,(分散は)=約0.7 かな?
 
ひとまとまりのデータ(1,2,3) あるいは別の(2,3,4)の各分散は双方とも,
0.7(≒0.67)ですね。(どちらも,分散=1 とすることはできません)
    • good
    • 0

分散というのは,なにか? ご自分で,定義で(計算方法も)確認してください。



1,2,3なら,=約1.3 かな? 
・エクセル(Excel)で関数を用いて……  =var.p(1,2,3)
・分散=偏差平方和÷データ個数  
・偏差平方和 =(1-2)^2 +(2-2)^2 +(3-2)^2
    • good
    • 0

脇からごめんなさい。



例えば,
あるクラスの数学1の得点(の分布)が 正規分布であり,その平均値が μ1,しかもそのクラスの数学2の得点も正規分布で,平均値は μ2だとだった と,します。
数学1と数学2の得点の和=合計点が 数学の得点なら,「数学の得点」というのは 2つの正規分布の和であり,新たな一つの正規分布です。
その新しい平均値は μ1+μ2だ というのは 巷の解説どおりですね。

それと,
>Aグループ:(1,2,3)は、平均=2、分散=1 
というのは,(平均=2 はいいけれど, 分散の計算値は)正しいですか?
    • good
    • 1
この回答へのお礼

非常に分かりやすい説明です!待ってました!
Aグループ:(1,2,3)の分散は2でしょうか?
分散の足し算も分かりやすく教えて頂けると幸いです。単純に、2+2=4でしょうか?

お礼日時:2019/01/22 17:39

No.4です。

「お礼」に書かれたことについて。

>では、なぜそう表記しないか、新たな疑問が沸きます。いくつかのサイトがそう表記しているでの、単なる表記ミスとは考えられないです。なにか理由があるのでしょうか?それとも単なるミスでしょうか?

あのね、いつまでも自分の思い込みで考えるのではなく、#4 の最初に書いた「根本的」「本質的」な認識の違いを、まず最初に修正してください。
    • good
    • 0

No.2&3 です。

「補足その2」を見ました。

あのね、ですから #2 に書いたように、あなたは「正規分布の和」の意味を正しく理解していないのです。
#2 に書いたように、「正規分布の和」とは、正規分布する「X」と「Y」があったときに、「X の中からその要素 x を、Y の中からその要素 y を無作為に取り出して
 z = x + y
とした「z の分布:Z」の話をしているのです。「分布」の話です。

↓ 例えばこんなサイトで、最初に「2つの正規分布をする集団があって、それぞれの集団からランダムに1つずつ要素を取り出し、その和を求め、その和を要素とする新しい集団を作るとき、この集団も正規分布をする性質がある」と書いてありますよね。
http://www.aandt.co.jp/jpn/qc/basic/seiki_kahou. …

あなたの挙げた例題は「正規分布の和」という「分布」の話ではなくて、単なる2つのグループを合算した統計量の「平均」や「分散」の話です。グループのくくり方が変われば、「平均」や「分散」は当然ながら「再計算」しないといけません。
まさか
・あるクラスの男子の平均点が70点。
・そのクラスの女子の平均点が80点。
・なので、そのクラス全体の平均点は150点。
などということがあり得ないのは自明でしょ?

「平均」や「分散」の「再計算」ということであれば、統計量
 X = {x1, x2, x3, ・・・, xn}
 Y = {y1, y2, y3, ・・・, ym}
を考えたときに
 μ1 = (1/n)Σ[i=1~n]xi
 μ2 = (1/m)Σ[j=1~m]yj
です。なので、これを合算した
 Z = X + Y = {x1, x2, ・・・, xn, y1, y2, ・・・, ym}
という統計量を考えれば、Z の平均は
 μ = (n・μ1 + m・μ2)/(n + m)
です。

また、もともとの分散は
 V1 = (1/n)Σ[i=1~n](xi - μ1)^2
 V2 = (1/m)Σ[j=1~m](yj - μ2)^2
ですから、Z の分散は
 V = [1/(n + m)]Σ[ (xi - μ)^2 + (yj - μ)^2 ]
  = [1/(n + m)]Σ(xi - μ)^2 + [1/(n + m)]Σ(yj - μ)^2
  = [1/(n + m)]n・V1 + [1/(n + m)]m・V2
  = (n・V1 + m・V2)/(n + m)
です。
この場合にも、n=m の場合には
 V = (V1 + V2)/2
が成り立ちます。

とにかく、最初に書いたとおり、「2つのグループを合算した、新しいグループの母数」の再計算と、「正規分布の和」でいう「分布」の特性の話ではありません。
あなたは単純に「間違った思い込み」(用語の定義の間違った認識)で悩んでるだけですよ。
    • good
    • 0
この回答へのお礼

(n・V1 + m・V2)/(n + m)ですね。では、なぜそう表記しないか、新たな疑問が沸きます。いくつかのサイトがそう表記しているでの、単なる表記ミスとは考えられないです。なにか理由があるのでしょうか?それとも単なるミスでしょうか?
とにかく、新たな平均も、新たな分散も、「その値の和ではない」ことは算数素人にも分かります。でもなぜ、値の和と解説しているのでしょうか???

お礼日時:2019/01/21 10:40

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!