外出自粛中でも楽しく過ごす!QAまとめ>>

二つの標準偏差σaとσbがあったとします。
このとき両者の平均値は(σa+σb)/2ではなく、
SQRT((σa^2+σb^2)/2)
となるらしいのですがどうして単純に足して割るだけではだめなのでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (3件)

σaのサンプル数が100で


σbのサンプル数が10だったら

単純に標準偏差の相加平均ではむりでしょう。

サンプル数が大きいほうが重みがあるのです。

aのサンプル数が100 σaが 50で
bのサンプル数が 10 σbが 5で

σ が27.5はおかしくないですか?
    • good
    • 0

文脈がはっきりしませんが、


この場合の「標準偏差」が、同一の母集団からとられた独立な
2つの標本の標準偏差のことを指しているとすれば、
この場合の「平均値」とは、両方の標本を一つに合わせたときの
分散の平均値と考えるのが普通です。標準偏差はその結果の平方根
をとったものにすぎず、決して標準偏差自体の平均ではありません。
さらに、その場合に両方のサンプルサイズが同じであれば、平均は
SQRT((σa^2+σb^2)/2)
になります。しかし、この式は、以上のように、状況をはっきり
させないと、結論できないのです。
平均だから足して2で割ると安直に考えてはいけません。

統計の本で勉強されているのであれば、結論の式だけでなく
どういう条件を設定しているのかを、もう一度、確認してみることをお勧めします。
    • good
    • 2

それは、「平均値」という言葉の意味の問題です。



二つの値 σa と σb に対して、(σa + σb) / 2 を「算術平均」、
√( (σa^2 + σb^2) / 2 ) を「二乗平均」と言います。
他にも、「○○平均」と名の付くものは、沢山あります。
その中で、特に断らなければ、算術平均のことを
単に「平均」と呼ぶ習慣になっているのです。

標準偏差について、算術平均ではなく二乗平均を求めるとウレシイのは、
二つの集団の平均値が共通で、標準偏差が一方は σa、他方は σb だとすると、
両者を併せて一つの集団としたとき、その標準偏差がσa と σb の二乗平均
になるからです。

σa と σb の(算術)平均は、あくまで (σa + σb) / 2 であって、
そのことに変わりはありません。
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

QExcelで平方2乗平均を計算するには

Excel2003で
平方2乗平均を計算するにはどうしたら良いのでしょうか?
手っ取り早い方法を教えて下さい。
よろしくお願い致します。

Aベストアンサー

訂正。

誤:平方2乗平均は、各要素を2乗した物の和の平方根です。
正:平方2乗平均は、各要素を2乗した物の和を要素数で割った物の平方根です。

従って、A1~A30の30個のセルの平方2乗平均は以下の式で求めます。
=SQRT(SUMSQ(A1:A30)/COUNT(A1:A30))

平方和を要素数で割るのを忘れてました。

Q統計学的に信頼できるサンプル数って?

統計の「と」の字も理解していない者ですが、
よく「統計学的に信頼できるサンプル数」っていいますよね。

あれって「この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる」という決まりがあるものなのでしょうか?
また、その標本数はどのように算定され、どのような評価基準をもって客観的に信頼できると判断できるのでしょうか?
たとえば、99人の専門家が信頼できると言い、1人がまだこの数では信頼できないと言った場合は信頼できるサンプル数と言えるのでしょうか?

わかりやすく教えていただけると幸いです。

Aベストアンサー

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。
 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル(比べるための基準となるサンプル)を比較するときに、そのサンプルの分布が正規分布(正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式)でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。それ以下では、いくらデータに差があるように見えても検定で差を検出できません。
 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合(分散値)、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された(差を出すために)必要なサンプル数だけサンプルデータを集めれば、差があると判定されます(すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる)。よって、集めるサンプルの種類により、計算上出された(差を出すために)必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。

 具体的に例示してみましょう。
 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。一見すると後者のほうが値が大きく、前者と差があるように見えます。そこで、差を検定するために、t検定を行います。結果として計算上差があり、前者と後者は計算上差がないのにあると間違えて判断する可能性の許容値(有意確率)何%の確率で差があるといえます。常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。
 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0.8とした場合に5.7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。有意確率5%で差があるとはいえない結果になります。この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551.33となり、552個もサンプルを抽出しないと差が出ないことになります。この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。

 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲(小数点何桁レベルの誤差)に納まるようなサンプル数を算出していると考えます。テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。

> どのような評価基準をもって客観的に信頼できると判断・・・
 例えば、工場で作られるネジの直径などは、まったくばらつきなくぴったり想定した直径のネジを作ることはきわめて困難です。多少の大きさのばらつきが生じてしまいます。1mm違っても規格外品となります。工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。しかし、製品をすべて調べるわけにはいきません。そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。
 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。
 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。

 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。
 ただ、経験則上指標的なものはあります。正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない(それ以下でも問題ない場合もある)とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。でも、あくまでも指標です。

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な...続きを読む

Q標準偏差同士の計算はどうやるのですか?

例えば、
(6±0.2)÷(3±0.1)=
を計算すると、
答えが、5.8/3から16.2/2.9となるとおもうのですが。
もっとふくざつな四則計算になると歯が立ちません。

このような計算を簡潔に解ける方法はあるのでしょうか?

また、Mathematicaで解くことは出来ますか?

Aベストアンサー

±をどういう意味だと思うかによって、話が違います。

[1] ご質問は「標準偏差同士の計算」となっていますから、±の後ろにある数値は標準偏差のお積もりでしょうかね。だとすると、
> (6±0.2)÷(3±0.1)=
> を計算すると、
> 答えが、5.8/3から16.2/2.9となる
 そうとは限らないです。たとえば分子と分母がそれぞれ正規分布に従う場合を考えると、分子も分母も(僅かな確率ですが)平均値からうんとかけ離れた値を取りうる。だから、取りうる値の範囲(最大・最小)は幾らでも大きくなります。じゃあ割り算した結果の(範囲ではなくて)標準偏差は幾らか、ということが気になる訳ですが、それは分子がどんな分布に従っているか、分母がどんな分布に従っているか、分子と分母が相関を持つかどうか、また、分母が0以下になる確率が0かどうかでも話が違ってきます。だから、標準偏差だけでは情報不足で答が出ません。

[2] しかし (ご質問のタイトルとは違って)もし±の後ろにある数値が範囲を表している(つまり、6±0.2なら最大6.2, 最小5.8という意味)ならば、
「6-0.2≦x≦6+0.2, 3-0.1≦y≦3+0.1のとき、x ÷ y の範囲を求める」
という形の問題だと考えれば、答の範囲が決められます。もっと複雑な演算でも同じことですね。

[3] ところで、もし±の後ろにある数値が、有限の桁数で数値計算をする際に生じる誤差の見積もりを表している(つまり、6±0.2なら0.2程度の誤差が含まれているという意味)なら、もうちょっと別のアプローチもあります。
 もちろん、±の後ろに付いているのが範囲を表していると思えば上記[2]の話と同じことですけれども、そのやり方ではあまりに悲観的すぎる。計算を繰り返して行くと、±の後ろの部分がどんどん大きくなってしまう。
 でも実際には、計算のたびに生じる誤差同士が互いに打ち消し合う効果があるために、答の誤差はそんなには大きくならない。この事を考慮した実用的な誤差の見積もり方として、「精度保証付き数値計算」と呼ばれる工学理論があります。

±をどういう意味だと思うかによって、話が違います。

[1] ご質問は「標準偏差同士の計算」となっていますから、±の後ろにある数値は標準偏差のお積もりでしょうかね。だとすると、
> (6±0.2)÷(3±0.1)=
> を計算すると、
> 答えが、5.8/3から16.2/2.9となる
 そうとは限らないです。たとえば分子と分母がそれぞれ正規分布に従う場合を考えると、分子も分母も(僅かな確率ですが)平均値からうんとかけ離れた値を取りうる。だから、取りうる値の範囲(最大・最小)は幾らでも大きくなります。じゃあ割...続きを読む

Q標準偏差の比較

お世話になってます。
標準偏差の大きさの比較をしたく困っております。
例えば平均値A、標準偏差A’(A±A')と平均値B、標準偏差B’(B±B')の2つの集団があった場合、標準偏差のA'とB'の大きさを比較する場合、どのようにしたらいいのでしょうか?
つまり、2つの集団のバラツキの度合いを比較したいのですが、どのようにしたらいいのでしょうか?
教えて下さい。

Aベストアンサー

変動係数(coefficient of variance)というものがあり、これはA'÷A、B'÷Bです。AとBの値が大きく異なり例えば1桁ちがう場合、A'とB'の値は、同様にばらついていても桁が違ってしまいます。平均値で割ると桁に関係なくばらつき具合がわかります。おそらくcacheさんのご質問の内容はこのようなことなのでは?

Q標準偏差について

エクセルで、標準偏差の式は4種類あり
(STDEV、STDEVA 、STDEVP、STDEVPA)
違いがよくわかりません。
はじめの2つは分母が(n-1)、あとの2つは分母がn
となっています。

高校の数学で習ったときは、分母はnだったと思います。
この違いはなんですか?

(2つずつ同じ数式ですが、Aがあるのと無いのでは何が
 違うかわかりますか?)

エクセルのヘルプでは、下記のように書いてあります。

STDEV 引数を正規母集団の標本と見なし、標本に基づいて母集団の標準偏差の推定値を返します。

STDEVA 数値、文字列、および論理値を含む引数を正規母集団の標本と見なし、母集団の標準偏差の推定値を返します。

STDEVP 引数を母集団全体と見なし、母集団の標準偏差を返します。

STDEVPA 数値、文字列、および論理値を含む引数を母集団全体と見なし、母集団の標準偏差を返します。

Aベストアンサー

標準偏差そのものを求める計算は、質問者さんが言われるとおり、分母をnとするのが正しいです(実際は、分散を計算するときにnで割るのであって、標準偏差は(√分散)ですね)。

ですから、例えば、

部品を10万個作った。これら部品の寸法の平均および標準偏差を調べたい。

と言う場合は、暇な人がいれば、とにかく10万個の部品の寸法を全部測定して、全部の測定値から平均と分散、標準偏差を計算する。このとき、平均も分散も10万で割る。こうして求められた値は、とりもなおさず母集団の平均と分散であり、標準偏差はSTDEVPで計算するべき。

ところが、大抵の場合、10万個の部品全部の寸法を調べようなんて暇な人はいないわけで、10万個作ったうちの100個を無作為に抜き出して測定して、その100個の測定値の平均値や標準偏差を求めようとする。このように、母集団(10万個)から100個抜き出した標本の平均を計算するときには100で割り、標本の分散そのものを計算するときも100で割る。こうして求めた標本の平均や分散は、母集団のそれと区別して、標本平均とか標本分散と呼ばれるのですが、標本の標準偏差そのものを求めるときもSTDEVPを使って計算して良い(と思う)。
ところが、100個抜き出して検査を行った元々の目的は、母集団の平均や標準偏差を「推定しましょう」ということであって、標本平均や標本分散を求めれば良いというほど実は単純ではない。抜き取り検査をして、標本平均と標本分散を求め、標本を母集団にもどしてまた抜き取り検査をする。これを何度も何度も繰り返す。このとき、繰り返し求められた標本平均の平均がどうなるか、標本分散の平均がどうなるかを調べてみると、標本平均の平均は、どうやら母集団の平均値(強いていうなら真値ですね)に近づくのだけど、ちょっと不思議なことに、標本分散の平均は母集団の分散に近づいてくれない。ということで、標本分散をもってして母集団の分散の推定量とするのはどうも怪しい。

推定量の平均が母集団の母数(平均とか分散)になるとき、その推定量を不偏推定量といいますが、上で述べたように標本平均は不偏推定量なんだけれど、標本分散は不偏推定量ではない。そこで編み出されたのが、標本から分散の推定量を計算するときにnで割るのではなく(n-1)で割る方法で、こいつが分散の不偏推定量になっているため不偏分散と呼んばれたりする。で、(√不偏分散)を計算してくれるのがSTDEV。

ということで、
STDEVPは母集団または標本(を母集団と見なして)の標準偏差を計算してくれる。
一方、STDEVは標本の(√不偏分散)を計算してくれるが、これは「標本の標準偏差」ではなく、「母集団の標準偏差の推定値」である。

じゃあ、母集団の標準偏差の推定値はSTDEVで計算しないと誤りなのか、と言われると、それがまたややこしい。不偏推定量というのは、その期待値が母集団と一致するという点では一応確からしいわけなんだけど、そのほかにも推定量としての確からしさを見積もる方法はいろいろとあって、(n-1)で割る不偏分散が必ずしも一番確からしいとは言えないと思う。最尤推定量っていうのもあるのだけど、不偏分散は最尤推定量ではなく、標本分散の方が最尤推定量だったりもする。

まあ、現実問題としてはnが適当に大きければ標本分散と不偏分散の違いは問題にならない場合が多いのであまり気にした事はありませんし、それが気になるような場合は、他に問題がある場合の方が多いので、どっちでもいーよなーと大雑把な私はいつも思ってる。

標準偏差そのものを求める計算は、質問者さんが言われるとおり、分母をnとするのが正しいです(実際は、分散を計算するときにnで割るのであって、標準偏差は(√分散)ですね)。

ですから、例えば、

部品を10万個作った。これら部品の寸法の平均および標準偏差を調べたい。

と言う場合は、暇な人がいれば、とにかく10万個の部品の寸法を全部測定して、全部の測定値から平均と分散、標準偏差を計算する。このとき、平均も分散も10万で割る。こうして求められた値は、とりもなおさず母集団の平均と...続きを読む

Q2つの正規分布を合成したらどうなるのでしょうか?

現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。
どうかご教授よろしくおねがいします。


平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが



例えば互いに独立で

国語の平均点、分散を(μ1,σ1)としての正規分布f(国語)
数学の平均点、分散を(μ2,σ2)としての正規分布f(数学)

とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか?

もしμ3=μ1+μ2,σ3=σ1+σ2のように平均も分散も和で考えてよいのなら

f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2}

が答えだと思っているのですが、それとは別のやり方で



f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と
f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。

しかし、僕の数学の知識ではこれができなくて困っています。ガウス積分の公式を使ったりしなければいけないのではないかとも考えいるのですが行き詰っています。

アドバイスよろしくお願いいたします。

現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。
どうかご教授よろしくおねがいします。


平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが



例えば互いに独立で

国語の平均点、分散を(μ1,σ1)としての正規分布f(国語)
数学の平均点、分散を(μ2,σ2)としての正規分布f(数学)

とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか?

...続きを読む

Aベストアンサー

> 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが
一般的には分散をσ^2と表し、標準偏差はその平方根でσと表します。
質問者さんが示された確率密度関数は、平均 μ、分散 「σ^2 」の正規分布のものです。分散と標準偏差の扱いをもう少しきちんとしましょう。

> μ3=μ1+μ2, σ3=σ1+σ2のように平均も分散も和で考えてよいのなら
2つの確率変数 X, Y があり、それぞれの平均と「分散」がμ1, (σ1)^2, μ2, (σ2)^2 であるとします。確率変数 Z を Z = X + Y で定め、Z の平均と「分散」をμ3, (σ3)^2 とすると・・・

μ3 = μ1 + μ2
は、X, Y がどのような分布であっても(X, Y が異なる分布であっても)成立しますし、X, Y が互いに独立であるか否かに関わらず成立します。
また、X, Y が互いに独立であれば(それらの分布によらず)、
(σ3)^2 = (σ1)^2 + (σ2)^2
が成立します。(このとき Z = X + Y の「標準偏差」σ3 は、σ3 = √( (σ1)^2 + (σ2)^2 ) )

> f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2}
> が答えだと思っているのですが
X, Y が互いに独立な確率変数であり、共に正規分布に従うならば、X + Y もまた正規分布に従うという事実は確かにありますが、これは正規分布の「再生性」と呼ばれる特別な性質であることを理解していなければなりません。その点、大丈夫ですか?

> それとは別のやり方で
> f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と
> f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。
上述したように、正規分布の再生性を示す必要があるならば、畳み込み積分でそれを示すのが一法なのであって、何も「別のやり方」ではありません。
案ずるより計算するが易しです。式の整理が面倒なだけで、特別な知識は不要です。
f(x) = 1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}
g(x) = 1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}
h(x) = ∫f(t) g(x - t) dt
  = 1/(2πσ1 σ2) ∫exp{ - (t - μ1)^2 / (2σ1^2) - (x - t - μ2)^2 / (2σ2^2) } dt
  epx( ) の指数部を t で平方完成して
  = 1/(2πσ1 σ2) ∫exp{ - (t - 何ちゃら )^2 / (2σ1^2 σ2^2 / (σ1^2 + σ2^2)) - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) } dt
  = 1/(2πσ1 σ2) exp{ - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) } ∫exp{ - (t - 何ちゃら )^2 / (2σ1^2 σ2^2 / (σ1^2 + σ2^2))} dt
  = 1/√(2π(σ1^2 + σ2^2)) exp{ - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) }
  (∵ ∫ exp ( - (t - A)^2 / 2B^2 ) dt = √(2π) B )
μ3 = μ1 + μ2, σ3^2 = σ1^2 + σ2^2 とおけば
h(x) = 1/(√(2π) σ3) exp( - (x - μ3)^2 / 2 σ3^2 )
途中、「何ちゃら」の部分は省略してますので、興味があれば追っかけてみてください。

なお、本件は確率論において、ごくごく基本的な事項です。
もし、これから確率統計を使って研究をされるのならば、このような件を簡単に質問して済ませるのは危うい感じがします。ちゃんと書籍を読まれ、その上で質問されるのが宜しいでしょう。

> 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが
一般的には分散をσ^2と表し、標準偏差はその平方根でσと表します。
質問者さんが示された確率密度関数は、平均 μ、分散 「σ^2 」の正規分布のものです。分散と標準偏差の扱いをもう少しきちんとしましょう。

> μ3=μ1+μ2, σ3=σ1+σ2のように平均も分散も和で考えてよいのなら
2つの確率変数 X, Y があり、それぞれの平均と「分散」がμ1, (σ1)^2, μ2, (σ2)^2 であるとします。確率変数 Z を Z = X + Y で定め、Z ...続きを読む

Qエクセルでの複数条件下での標準偏差の求め方

教えてください。エクセル2007を使用しています。僕はエクセル初心者ではありませんが、玄人でもない中級者くらいだと思います。早速ですが、例えばA列に男か女かの性別、B列に日本、アメリカなどの国籍、C列に東京、フロリダなどの州、県、D列に右利きか左効きか、E列に年齢が書いてある表において、「男、日本、埼玉、右利き」の人の「年齢」の「標準偏差(STDEV)」を求めようとしたとき、計算する方法がわかりません。ソートをかけて求める方法も考えましたが、内容や位置がコロコロ変わるため、向いていないと思ってます。平均値ならAVERAGEIFSで出せますし、合計ならSUMIFSがあると思います。1つの条件(たとえば、「日本」の「年齢」の標準偏差)ならば、なんとかできますが、このような場合の関数はあるのでしょうか?もしなければ、どのように算出するのか教えて頂ければありがたいです。よろしくお願いいたします。

Aベストアンサー

方法1:
=STDEV(IF((A1:A100="男")*(B1:B100="日本")*(C1:C100="東京")*(D1:D100="左"),E1:E100))
と数式バーに記入して,コントロールキーとシフトキーを押しながらEnterで入力します


方法2:
STDEVの基本式
=SQRT((N*Σ(x^2)-(Σx)^2)/(N*(N-1)))
で計算します(関数のヘルプを参照の事)

NはCOUNTIFS関数,ΣxはSUMIFS関数で計算できますが,Σ(x^2)については
=SUMPRODUCT((A1:A100="男")*(B1:B100="日本")*(C1:C100="東京")*(D1:D100="左"),E1:E100,E1:E100)
といった具合に求める必要があります。

Q加重平均と平均の違い

加重平均と平均の違いってなんですか?
値が同じになることが多いような気がするんですけど・・・
わかりやす~い例で教えてください。

Aベストアンサー

例えば,テストをやって,A組の平均点80点,B組70点,C組60点だったとします.
全体の平均は70点!・・・これが単純な平均ですね.
クラスごとの人数が全く同じなら問題ないし,
わずかに違う程度なら誤差も少ないです.

ところが,A組100人,B組50人,C組10人だったら?
これで「平均70点」と言われたら,A組の生徒は文句を言いますよね.
そこで,クラスごとに重みをつけ,
(80×100+70×50+60×10)÷(100+50+10)=75.6
とやって求めるのが「加重平均」です.

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む


人気Q&Aランキング