ある集団の体重の分布は、平均値60㎏、分散8²㎏に従う正規分布である。
このとき、無作為に抽出した2人の体重差が4㎏を超える確率を求めるにはどうすればよいですか?
正規分布について、正規化することや標準正規分布の読み取は出来ます。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

#1です。



>感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

について、2つの説明をします。

①モンテカルロ・シミュレーション
N(60,8^2)に従う正規乱数を2個作って、
それらの差の絶対値が4を超えたらカウントするという操作を
10万回繰り返し、全体に占める割合を算出しました。
以下は、Rというフリーの統計ソフトのスクリプトです。

counter <- 0
iterate <- 0
while(iterate < 100000){
x1 <- rnorm(1,60,8)
x2 <- rnorm(1,60,8)
counter <- counter + ifelse(abs(x1 - x2) > 4,1,0)
iterate <- iterate + 1
}
counter / iterate

結果は、 0.72165 でした。
前にお示しした計算値に近い値になりました。

②正規分布に従う無作為標本のレンジ(範囲)Rの期待値
n個の無作為標本の範囲はどんな値になるか。
品質管理には、次のような式があります。
σ=R/d2
n=2のとき、d2≒1.12838
σ=8 なので、よって、R=8×1.12838=9.02704
つまり、σ=8の集団から得られるn=2の標本は、
平均的には約9の範囲があるのです。
4以上の開きが出るのは、違和感が無いというより、
むしろ当然なのです。
    • good
    • 0
この回答へのお礼

再度の質問にも丁寧に答えていただき感謝します。
良く分かりました。ありがとうございました。
もう少し基本的なことから学びなおします。

お礼日時:2016/12/15 06:33

分散 8² ということは、標準偏差が 8 (kg) ということはよいですね?



2人の体重差 (X1 - X2) の分布は、X1、X2 の各々が N(60, 8²) に従うので
 平均値 = 60 - 60 = 0
 分散:σ² = 8² + 8² = 128
ということになります。この場合の標準偏差は
 σ = √128 ≒ 11.3 (kg)  ←要するに 8 (kg) * √2
になります。

従って、 体重差 4 kg は
  4/ 11.3 ≒ 0.354σ
ということになります。

ということで、N(0, 11.3²) で分布する「体重差」が 0 ± 4 kg (平均値 ± 0.354σ ) の外側になる確率を求めればよいのです。

この確率は、標準正規分布表から(例えば下記)から、Z=0.35 を読み取って「0.3632」、Z=0.36なら 「0.3594」。
これが「片側確率」なので、「両側確率」は、おおよそ
  0.36 * 2 = 0.72
ということです。

標準正規分布表
https://staff.aist.go.jp/t.ihara/normsdist.html

>感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

 どのような根拠でそう考えるのですか?
 そもそもが N(60, 8²) で分布しているので、体重差が確実に 4 kg 以下というのは平均値付近で見れば、2人とも
 60 ± 2 kg
ということなので、これが
 平均値 ± (1/4)σ
であることから、この範囲に入るのは 0.2 程度の確率です。なので、体重差が 4 kg を越える確率が 0.72 というのは、それほど違和感はないように思います。
    • good
    • 0
この回答へのお礼

詳細なご説明ありがとうございます。
良く分かりました。

お礼日時:2016/12/15 06:32

分散の加法性の問題です。



x1もx2もN(60,8^2)に従いますので、
x1-x2は分散の加法性により、N(0,128)に従います。

このとき、差が4を超えるのは、4/√128・σ外の時だから、
それを計算して、±0.3535σ
この両側裾野確率は0.7236736

一瞬、ドキっとする問題ですが、冷静に考えれば、
テキストに出てくる練習問題と同じです。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
補足質問よろしいですか?
この両側裾原確率0.7236736が4kgを超える確率ですか?
感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

お礼日時:2016/12/14 18:31

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aと関連する良く見られている質問

Q正規分布の確率計算について

統計学の宿題が出ているのですが・・・どうしてもわかりません(ToT)
今月末が締め切りなのですが、朝まで考えても、結局どうすることもできませんでした(悲)

■正規分布 N ( m , s^2 ) において、次の確率などを求めよ。( ただし、s^2 は s の2乗を表す。)
1)P ( X < m + 0.5s ) ( ただし、0.5s は 0.5 * s を、つまり、s の0.5倍を表す。)
2)P ( X > m - 1.5s )
3)P ( m - 0.7s < X < m + 1.4s )
4)P ( X > a ) = 0.65 となる a を m と s で表せ。
5)P ( m - 0.8s < X < b ) = 0.75 となる b を m と s で表せ。
6) P ( c < X < m + 1.6s ) = 0.84 となる c を m と s で表せ。

という問題です。
『Excelで学ぶ統計』といった授業ですので、Excelを用いて解くことができると思うのですが、一体どういった過程を経て解けばよいのか、どういった関数を用いればよいのか・・・みなさんのお知恵をお借りしたい次第です。
よろしくお願いします<m(__)m>

統計学の宿題が出ているのですが・・・どうしてもわかりません(ToT)
今月末が締め切りなのですが、朝まで考えても、結局どうすることもできませんでした(悲)

■正規分布 N ( m , s^2 ) において、次の確率などを求めよ。( ただし、s^2 は s の2乗を表す。)
1)P ( X < m + 0.5s ) ( ただし、0.5s は 0.5 * s を、つまり、s の0.5倍を表す。)
2)P ( X > m - 1.5s )
3)P ( m - 0.7s < X < m + 1.4s )
4)P ( X > a ) = 0.65 となる a を m と s で表せ。
5)P ( m - 0.8s < X < b ) = 0.75 となる b ...続きを読む

Aベストアンサー

問題が解けない原因はm,sが未知だからと思います。
まず基本的なこととして、確率変数Xが正規分布N(m,s^2)に従うとき、
aX+bは正規分布N(am+b,(as)^2)に従うといったことがあります。
ここで、a=1/s、b=-m/sとすると、すなわち、(X-m)/sは標準正規分布
N(0,1)に従います。このXを(X-m)/sにするのを正規化といいます。
このように、平均、分散が既知の分布に帰着させるのです。
これから1の問題を考えると、X<m+0.5sは(X-m)/s<0.5と変形され、
標準正規分布において0.5未満の確率を求めることになります。
他の問題も同様に考えてみてください。

Q標準正規分布表の見方について

標準正規分布表から、Z~N(0、1)である正規確率変数について
(1)Z<1.5の確率を求めよ。
(2)Pr{Z<Z₁}=0.95となるZ1をもとめよ。
(3)Pr{-Z₁<Z<Z₁}=0.95となるZ1をもとめよ。

この問題の答えとなぜそうなるのかという具体的でバカにもわかるような易しい解説をどなたかお願いします。

Aベストアンサー

標準正規分布表は、どれも同じ形式とは限りません。同じもの使って、慣れることが必要です。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
について説明します。
特に、Z(中心からの距離を正規化したもの)と、P(0~Z)を混乱しないようにしっかり把握することが必要です。数表によっては、P(-∞~Z)だったりP(Z~∞)だったりします。

(1)Z<1.5の確率を求めよ。
Z=1 に相当するPは0.4332です。ただし、この値はグラフの左半分を無視しているので、P(Z<1.5)は、0.5+0.4332で探さなければなりません。

(2)Pr{Z<Z₁}=0.95となるZ1をもとめよ。
前問とは逆に、P=0.95-0.5=0.45として表を引く必要があります。Z1=1.64と1.65の間となりますので、答は1.645としておきましょう。

(3)Pr{-Z₁<Z<Z₁}=0.95となるZ1をもとめよ。
これは「左右対称になるように両端を切り落とせ」ということですから、P=0.475であり、Z1=0.12。これは、偏差値38~62の人は全体の95%になる、というのと同じ意味になります。

標準正規分布表は、どれも同じ形式とは限りません。同じもの使って、慣れることが必要です。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
について説明します。
特に、Z(中心からの距離を正規化したもの)と、P(0~Z)を混乱しないようにしっかり把握することが必要です。数表によっては、P(-∞~Z)だったりP(Z~∞)だったりします。

(1)Z<1.5の確率を求めよ。
Z=1 に相当するPは0.4332です。ただし、この値はグラフの左半分を無視しているので、P(Z<1.5)は、0.5+0.4332で探...続きを読む

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q確率問題の計算式を簡単に教えてください

【問題】
50枚のスピードくじが有り、2枚が当りです。
5枚引いて当りの出る確率は何パーセントでしょう。

学校を卒業してから約20年。
ネットで検索して何とか回答を求めたのですが、自信が無いので、簡単に計算式と回答をお願いします。

自分が思うには、1/25+1/25+1/25+1/25+1/25=1/5
なのですがあっていますか?

Aベストアンサー

>1/25+1/25+1/25+1/25+1/25=1/5
これだと、25枚ひいたときには確率が1になり、必ず当たると言うことになりますよね。実際はそうはいきません。

「あたりが出る確率」の解釈は、「一枚も当たらない」の裏返し。1枚当たり、2枚当たりも含みます。

50枚の中から5枚を選ぶ組み合わせは、50C5、
48枚の中から5枚のはずれを拾う組み合わせは、48C5
よって、確率は、
1-48C5/50C5
=1- {(48*47*46*45*44)/(5*4*3*2*1)}/{(50*49*48*47*46)/(5*4*3*2*1)}
=1- (48*47*46*45*44)/(50*49*48*47*46)
=1- (45*44)/(50*49)
=0.19

Q2つの正規分布を合成したらどうなるのでしょうか?

現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。
どうかご教授よろしくおねがいします。


平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが



例えば互いに独立で

国語の平均点、分散を(μ1,σ1)としての正規分布f(国語)
数学の平均点、分散を(μ2,σ2)としての正規分布f(数学)

とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか?

もしμ3=μ1+μ2,σ3=σ1+σ2のように平均も分散も和で考えてよいのなら

f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2}

が答えだと思っているのですが、それとは別のやり方で



f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と
f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。

しかし、僕の数学の知識ではこれができなくて困っています。ガウス積分の公式を使ったりしなければいけないのではないかとも考えいるのですが行き詰っています。

アドバイスよろしくお願いいたします。

現在大学の研究の過程で統計学を学ぶ必要がでてきました。僕自身は統計学に詳しくはないので知識のある方の回答は非常に助かります。
どうかご教授よろしくおねがいします。


平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが



例えば互いに独立で

国語の平均点、分散を(μ1,σ1)としての正規分布f(国語)
数学の平均点、分散を(μ2,σ2)としての正規分布f(数学)

とした時の国語と数学の合計得点の分布f(国語+数学)はどのように表せばよいのでしょうか?

...続きを読む

Aベストアンサー

> 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが
一般的には分散をσ^2と表し、標準偏差はその平方根でσと表します。
質問者さんが示された確率密度関数は、平均 μ、分散 「σ^2 」の正規分布のものです。分散と標準偏差の扱いをもう少しきちんとしましょう。

> μ3=μ1+μ2, σ3=σ1+σ2のように平均も分散も和で考えてよいのなら
2つの確率変数 X, Y があり、それぞれの平均と「分散」がμ1, (σ1)^2, μ2, (σ2)^2 であるとします。確率変数 Z を Z = X + Y で定め、Z の平均と「分散」をμ3, (σ3)^2 とすると・・・

μ3 = μ1 + μ2
は、X, Y がどのような分布であっても(X, Y が異なる分布であっても)成立しますし、X, Y が互いに独立であるか否かに関わらず成立します。
また、X, Y が互いに独立であれば(それらの分布によらず)、
(σ3)^2 = (σ1)^2 + (σ2)^2
が成立します。(このとき Z = X + Y の「標準偏差」σ3 は、σ3 = √( (σ1)^2 + (σ2)^2 ) )

> f(国語+数学)=1/((√2π)σ3) exp-{((x-μ3)^2)/2σ3^2}
> が答えだと思っているのですが
X, Y が互いに独立な確率変数であり、共に正規分布に従うならば、X + Y もまた正規分布に従うという事実は確かにありますが、これは正規分布の「再生性」と呼ばれる特別な性質であることを理解していなければなりません。その点、大丈夫ですか?

> それとは別のやり方で
> f(国語)=1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}と
> f(数学)=1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}をたたみこみ積分すれば答えがでるのではないかと考えています。
上述したように、正規分布の再生性を示す必要があるならば、畳み込み積分でそれを示すのが一法なのであって、何も「別のやり方」ではありません。
案ずるより計算するが易しです。式の整理が面倒なだけで、特別な知識は不要です。
f(x) = 1/((√2π)σ1) exp-{((x-μ1)^2)/2σ1^2}
g(x) = 1/((√2π)σ2) exp-{((x-μ2)^2)/2σ2^2}
h(x) = ∫f(t) g(x - t) dt
  = 1/(2πσ1 σ2) ∫exp{ - (t - μ1)^2 / (2σ1^2) - (x - t - μ2)^2 / (2σ2^2) } dt
  epx( ) の指数部を t で平方完成して
  = 1/(2πσ1 σ2) ∫exp{ - (t - 何ちゃら )^2 / (2σ1^2 σ2^2 / (σ1^2 + σ2^2)) - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) } dt
  = 1/(2πσ1 σ2) exp{ - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) } ∫exp{ - (t - 何ちゃら )^2 / (2σ1^2 σ2^2 / (σ1^2 + σ2^2))} dt
  = 1/√(2π(σ1^2 + σ2^2)) exp{ - (x - μ1 - μ2)^2 / 2 (σ1^2 + σ^2) }
  (∵ ∫ exp ( - (t - A)^2 / 2B^2 ) dt = √(2π) B )
μ3 = μ1 + μ2, σ3^2 = σ1^2 + σ2^2 とおけば
h(x) = 1/(√(2π) σ3) exp( - (x - μ3)^2 / 2 σ3^2 )
途中、「何ちゃら」の部分は省略してますので、興味があれば追っかけてみてください。

なお、本件は確率論において、ごくごく基本的な事項です。
もし、これから確率統計を使って研究をされるのならば、このような件を簡単に質問して済ませるのは危うい感じがします。ちゃんと書籍を読まれ、その上で質問されるのが宜しいでしょう。

> 平均μ、分散σで表される正規分布はf(x)=1/((√2π)σ) exp-{((x-μ)^2)/2σ^2}で表されますが
一般的には分散をσ^2と表し、標準偏差はその平方根でσと表します。
質問者さんが示された確率密度関数は、平均 μ、分散 「σ^2 」の正規分布のものです。分散と標準偏差の扱いをもう少しきちんとしましょう。

> μ3=μ1+μ2, σ3=σ1+σ2のように平均も分散も和で考えてよいのなら
2つの確率変数 X, Y があり、それぞれの平均と「分散」がμ1, (σ1)^2, μ2, (σ2)^2 であるとします。確率変数 Z を Z = X + Y で定め、Z ...続きを読む

Qエクセルで正規分布の作り方

色々紹介はされているとは思いますがいまいち作成方法がわかりませんので教えてください。
n=50で得点の正規分布図をエクセルで作成したいのですが具体的にどういう順番で処理すればよいでしょうか?よろしくお願いします。

Aベストアンサー

正規分布の曲線をプロットしたいのでしょうか?

エクセルの関数を使う方法はこちら
http://home.kanto-gakuin.ac.jp/~ahero/excel/func/norm_graph.shtml
曲線の方程式からプロットする方法はこちら
http://oshiete.goo.ne.jp/qa/853670.html

でも、平均値と標準偏差が解らないと描けないですね。
ご質問の意味が、得点と、頻度をプロットしたグラフという事なら、
単に、折れ線グラフだと思います。
具体的なデータ等補足していただかないと、的確な回答は付かないと存じます。

こんなサイトを見つけましたが、なかなか面白そうです。
http://homepage1.nifty.com/gfk/excel.htm
http://homepage1.nifty.com/gfk/average.htm

Q偏差値と正規分布の問題です。

ある試験で60点を取った人の偏差値と上位からの順位を求めよ。
ただし、平均は40.2点、標準偏差18.6点、受験者数は59人とする。

講義に欠席していたので答えがわかりません。
よろしくおねがいします。

Aベストアンサー

こんにちは。

平均点との差は、
60点-40.2点 = 19.8点
これを標準偏差で割ると、
19.8点 ÷ 18.6点 ≒ 1.06
よって偏差値は、
50 + 1.06×10 = 60.6

また、正規分布表で、+1.06(=1.0+0.06)のところを参照すると、0.8554 と書いてある。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/normdisttab.html
これは、1万人中、その人の下に8553人(まあ8554でもいいですが)がいて、上には1445人(まあ1446でもいいですが)がいるということなので、
59人中の順位 : 59人 = 1446位 : 10000人
となり、
59人中の順位 = 59×1446÷10000 ≒ 8.53(位)
つまり、8~9位。

なお、正規分布表にはいくつか種類があるので、もしも先生が指定している正規分布表があれば、それを使うのがよいでしょう。
その場合は、計算式が上記と若干異なる場合があります。
ただし、答えはまったく同じになりますけどね。

こんにちは。

平均点との差は、
60点-40.2点 = 19.8点
これを標準偏差で割ると、
19.8点 ÷ 18.6点 ≒ 1.06
よって偏差値は、
50 + 1.06×10 = 60.6

また、正規分布表で、+1.06(=1.0+0.06)のところを参照すると、0.8554 と書いてある。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/normdisttab.html
これは、1万人中、その人の下に8553人(まあ8554でもいいですが)がいて、上には1445人(まあ1446でもいいですが)がいる...続きを読む

Q確率変数とは

確率変数P{X=x}のXとxの違いがよく分かりません。というか確率変数の概念自体がよく分かりません。またなぜP{X=x}=P(x)なのかもわかりません。助けてください。

Aベストアンサー

まず、Xとxが紛らわしいですね。
P{X=x}=P(x)
を、
P{A=t}=f(t)
のように置き換えても、同じ意味ですので、こう置き換えて説明してみます。
確率変数というのは、最初に決めた、現象の集合と、実数との対応です。サイコロの例がよく出されますが、逆にわかりにくくしている面もあります。各面に、{a,b,c,d,e,f}という文字が書かれたサイコロを想像してみてください。さて、このサイコロで、{a,b,c}の文字が出る確率を知りたいとしますね。ところが、数学は「数」を扱う世界なので、文字は直接は扱えません。そこで、現象と数の対応を確率変数とします。この場合、確率変数Aを、
サイコロを振ってaが出たら、A=1
サイコロを振ってbが出たら、A=2
サイコロを振ってcが出たら、A=3
サイコロを振ってdが出たら、A=4
サイコロを振ってeが出たら、A=5
サイコロを振ってfが出たら、A=6
となる変数であると決めてしまいます。これで、現象->数への変換が出来ました。確率変数は、このように、本来数学では扱えない「現象の集合」を、数の集合に変換するのに使うのです。
P{A=t}のtは、正確に書くと、t∈実数です。つまり、実数を適当に一つ持ってきたのが、tです。
P{A=t}=f(t)は、現象の集合を確率変数Aで数に置き換えてやった時の値がtである確率が、f(t)という値と同じだよ。という意味です。

まず、Xとxが紛らわしいですね。
P{X=x}=P(x)
を、
P{A=t}=f(t)
のように置き換えても、同じ意味ですので、こう置き換えて説明してみます。
確率変数というのは、最初に決めた、現象の集合と、実数との対応です。サイコロの例がよく出されますが、逆にわかりにくくしている面もあります。各面に、{a,b,c,d,e,f}という文字が書かれたサイコロを想像してみてください。さて、このサイコロで、{a,b,c}の文字が出る確率を知りたいとしますね。ところが、数学は「数」を扱う世界なので、文字は直接は扱えません。...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q標準正規分布表

正規分布について
標準正規分布表(上側確率や下側確率)を参考に

次の確率を求めなさい。
(①,④,⑤:小数第四位までで答えなさい
②~③:小数第三位までで答えなさい)
①ZがN(0、1)に従うとき、P(Z≧1.25)
② ZがN(0、1)に従うとき、P(Z≧z)=0.15となるz
③ ZがN(0、1)に従うとき、P( Z ≦z)=0.90となるz
④ ZがN(10、25)に従うとき、P(X≦7.5)
⑤ ZがN(10、25)に従うとき、P(16≦X≦18)

手も足も出ません、どういう意味で何を求めさせたい問題なのでしょうか?

Aベストアンサー

「手も足も出ません」って、正規分布を教科書で勉強している途上での問題ですよね?
 だったら、悪いことは言いません、もう一度教科書に戻って、出直した方が良いです。

 N(0、1)とかN(10、25)というのは、N(μ、σ^2)の意味であるということは理解していますか?
 μ:平均、σ:標準偏差、σ^2:分散 です。
http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

 「標準正規分布」とは、N(0、1)のことです。
 この標準正規分布表(上側確率や下側確率)が与えられているのですよね? だったら、それから読み取る、端数は補間して求めればよいのです。

①では、P(Z≧1.25)とは、分散の「1.25」倍より大きいところに分布する確率です。標準偏差にすると、プラス側(○○以上)とマイナス側(-○○以下)の両方があります。
正規分布では、±1σの範囲内に68.3%、±2σの範囲内に95.4%が入りますよね。
 ↓ こんな図を参照。
http://www.geisya.or.jp/~mwm48961/statistics/stddiv1.htm

以下同様。
④ ⑤では、N(0、1)になるように「X」を変換するステップが必要になります。

「手も足も出ません」って、正規分布を教科書で勉強している途上での問題ですよね?
 だったら、悪いことは言いません、もう一度教科書に戻って、出直した方が良いです。

 N(0、1)とかN(10、25)というのは、N(μ、σ^2)の意味であるということは理解していますか?
 μ:平均、σ:標準偏差、σ^2:分散 です。
http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

 「標準正規分布」とは、N(0、1)のことです。
 この標準正規分布表(上側確率や下側確率)が与えられているの...続きを読む


このQ&Aを見た人がよく見るQ&A

このカテゴリの人気Q&Aランキング

おすすめ情報