ある集団の体重の分布は、平均値60㎏、分散8²㎏に従う正規分布である。
このとき、無作為に抽出した2人の体重差が4㎏を超える確率を求めるにはどうすればよいですか?
正規分布について、正規化することや標準正規分布の読み取は出来ます。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

#1です。



>感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

について、2つの説明をします。

①モンテカルロ・シミュレーション
N(60,8^2)に従う正規乱数を2個作って、
それらの差の絶対値が4を超えたらカウントするという操作を
10万回繰り返し、全体に占める割合を算出しました。
以下は、Rというフリーの統計ソフトのスクリプトです。

counter <- 0
iterate <- 0
while(iterate < 100000){
x1 <- rnorm(1,60,8)
x2 <- rnorm(1,60,8)
counter <- counter + ifelse(abs(x1 - x2) > 4,1,0)
iterate <- iterate + 1
}
counter / iterate

結果は、 0.72165 でした。
前にお示しした計算値に近い値になりました。

②正規分布に従う無作為標本のレンジ(範囲)Rの期待値
n個の無作為標本の範囲はどんな値になるか。
品質管理には、次のような式があります。
σ=R/d2
n=2のとき、d2≒1.12838
σ=8 なので、よって、R=8×1.12838=9.02704
つまり、σ=8の集団から得られるn=2の標本は、
平均的には約9の範囲があるのです。
4以上の開きが出るのは、違和感が無いというより、
むしろ当然なのです。
    • good
    • 0
この回答へのお礼

再度の質問にも丁寧に答えていただき感謝します。
良く分かりました。ありがとうございました。
もう少し基本的なことから学びなおします。

お礼日時:2016/12/15 06:33

分散 8² ということは、標準偏差が 8 (kg) ということはよいですね?



2人の体重差 (X1 - X2) の分布は、X1、X2 の各々が N(60, 8²) に従うので
 平均値 = 60 - 60 = 0
 分散:σ² = 8² + 8² = 128
ということになります。この場合の標準偏差は
 σ = √128 ≒ 11.3 (kg)  ←要するに 8 (kg) * √2
になります。

従って、 体重差 4 kg は
  4/ 11.3 ≒ 0.354σ
ということになります。

ということで、N(0, 11.3²) で分布する「体重差」が 0 ± 4 kg (平均値 ± 0.354σ ) の外側になる確率を求めればよいのです。

この確率は、標準正規分布表から(例えば下記)から、Z=0.35 を読み取って「0.3632」、Z=0.36なら 「0.3594」。
これが「片側確率」なので、「両側確率」は、おおよそ
  0.36 * 2 = 0.72
ということです。

標準正規分布表
https://staff.aist.go.jp/t.ihara/normsdist.html

>感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

 どのような根拠でそう考えるのですか?
 そもそもが N(60, 8²) で分布しているので、体重差が確実に 4 kg 以下というのは平均値付近で見れば、2人とも
 60 ± 2 kg
ということなので、これが
 平均値 ± (1/4)σ
であることから、この範囲に入るのは 0.2 程度の確率です。なので、体重差が 4 kg を越える確率が 0.72 というのは、それほど違和感はないように思います。
    • good
    • 0
この回答へのお礼

詳細なご説明ありがとうございます。
良く分かりました。

お礼日時:2016/12/15 06:32

分散の加法性の問題です。



x1もx2もN(60,8^2)に従いますので、
x1-x2は分散の加法性により、N(0,128)に従います。

このとき、差が4を超えるのは、4/√128・σ外の時だから、
それを計算して、±0.3535σ
この両側裾野確率は0.7236736

一瞬、ドキっとする問題ですが、冷静に考えれば、
テキストに出てくる練習問題と同じです。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
補足質問よろしいですか?
この両側裾原確率0.7236736が4kgを超える確率ですか?
感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

お礼日時:2016/12/14 18:31

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aと関連する良く見られている質問

Q正規分布の確率計算について

統計学の宿題が出ているのですが・・・どうしてもわかりません(ToT)
今月末が締め切りなのですが、朝まで考えても、結局どうすることもできませんでした(悲)

■正規分布 N ( m , s^2 ) において、次の確率などを求めよ。( ただし、s^2 は s の2乗を表す。)
1)P ( X < m + 0.5s ) ( ただし、0.5s は 0.5 * s を、つまり、s の0.5倍を表す。)
2)P ( X > m - 1.5s )
3)P ( m - 0.7s < X < m + 1.4s )
4)P ( X > a ) = 0.65 となる a を m と s で表せ。
5)P ( m - 0.8s < X < b ) = 0.75 となる b を m と s で表せ。
6) P ( c < X < m + 1.6s ) = 0.84 となる c を m と s で表せ。

という問題です。
『Excelで学ぶ統計』といった授業ですので、Excelを用いて解くことができると思うのですが、一体どういった過程を経て解けばよいのか、どういった関数を用いればよいのか・・・みなさんのお知恵をお借りしたい次第です。
よろしくお願いします<m(__)m>

統計学の宿題が出ているのですが・・・どうしてもわかりません(ToT)
今月末が締め切りなのですが、朝まで考えても、結局どうすることもできませんでした(悲)

■正規分布 N ( m , s^2 ) において、次の確率などを求めよ。( ただし、s^2 は s の2乗を表す。)
1)P ( X < m + 0.5s ) ( ただし、0.5s は 0.5 * s を、つまり、s の0.5倍を表す。)
2)P ( X > m - 1.5s )
3)P ( m - 0.7s < X < m + 1.4s )
4)P ( X > a ) = 0.65 となる a を m と s で表せ。
5)P ( m - 0.8s < X < b ) = 0.75 となる b ...続きを読む

Aベストアンサー

問題が解けない原因はm,sが未知だからと思います。
まず基本的なこととして、確率変数Xが正規分布N(m,s^2)に従うとき、
aX+bは正規分布N(am+b,(as)^2)に従うといったことがあります。
ここで、a=1/s、b=-m/sとすると、すなわち、(X-m)/sは標準正規分布
N(0,1)に従います。このXを(X-m)/sにするのを正規化といいます。
このように、平均、分散が既知の分布に帰着させるのです。
これから1の問題を考えると、X<m+0.5sは(X-m)/s<0.5と変形され、
標準正規分布において0.5未満の確率を求めることになります。
他の問題も同様に考えてみてください。

Q偏差値と正規分布の問題です。

ある試験で60点を取った人の偏差値と上位からの順位を求めよ。
ただし、平均は40.2点、標準偏差18.6点、受験者数は59人とする。

講義に欠席していたので答えがわかりません。
よろしくおねがいします。

Aベストアンサー

こんにちは。

平均点との差は、
60点-40.2点 = 19.8点
これを標準偏差で割ると、
19.8点 ÷ 18.6点 ≒ 1.06
よって偏差値は、
50 + 1.06×10 = 60.6

また、正規分布表で、+1.06(=1.0+0.06)のところを参照すると、0.8554 と書いてある。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/normdisttab.html
これは、1万人中、その人の下に8553人(まあ8554でもいいですが)がいて、上には1445人(まあ1446でもいいですが)がいるということなので、
59人中の順位 : 59人 = 1446位 : 10000人
となり、
59人中の順位 = 59×1446÷10000 ≒ 8.53(位)
つまり、8~9位。

なお、正規分布表にはいくつか種類があるので、もしも先生が指定している正規分布表があれば、それを使うのがよいでしょう。
その場合は、計算式が上記と若干異なる場合があります。
ただし、答えはまったく同じになりますけどね。

こんにちは。

平均点との差は、
60点-40.2点 = 19.8点
これを標準偏差で割ると、
19.8点 ÷ 18.6点 ≒ 1.06
よって偏差値は、
50 + 1.06×10 = 60.6

また、正規分布表で、+1.06(=1.0+0.06)のところを参照すると、0.8554 と書いてある。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/normdisttab.html
これは、1万人中、その人の下に8553人(まあ8554でもいいですが)がいて、上には1445人(まあ1446でもいいですが)がいる...続きを読む

Q標準正規分布表の見方について

標準正規分布表から、Z~N(0、1)である正規確率変数について
(1)Z<1.5の確率を求めよ。
(2)Pr{Z<Z₁}=0.95となるZ1をもとめよ。
(3)Pr{-Z₁<Z<Z₁}=0.95となるZ1をもとめよ。

この問題の答えとなぜそうなるのかという具体的でバカにもわかるような易しい解説をどなたかお願いします。

Aベストアンサー

標準正規分布表は、どれも同じ形式とは限りません。同じもの使って、慣れることが必要です。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
について説明します。
特に、Z(中心からの距離を正規化したもの)と、P(0~Z)を混乱しないようにしっかり把握することが必要です。数表によっては、P(-∞~Z)だったりP(Z~∞)だったりします。

(1)Z<1.5の確率を求めよ。
Z=1 に相当するPは0.4332です。ただし、この値はグラフの左半分を無視しているので、P(Z<1.5)は、0.5+0.4332で探さなければなりません。

(2)Pr{Z<Z₁}=0.95となるZ1をもとめよ。
前問とは逆に、P=0.95-0.5=0.45として表を引く必要があります。Z1=1.64と1.65の間となりますので、答は1.645としておきましょう。

(3)Pr{-Z₁<Z<Z₁}=0.95となるZ1をもとめよ。
これは「左右対称になるように両端を切り落とせ」ということですから、P=0.475であり、Z1=0.12。これは、偏差値38~62の人は全体の95%になる、というのと同じ意味になります。

標準正規分布表は、どれも同じ形式とは限りません。同じもの使って、慣れることが必要です。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm
について説明します。
特に、Z(中心からの距離を正規化したもの)と、P(0~Z)を混乱しないようにしっかり把握することが必要です。数表によっては、P(-∞~Z)だったりP(Z~∞)だったりします。

(1)Z<1.5の確率を求めよ。
Z=1 に相当するPは0.4332です。ただし、この値はグラフの左半分を無視しているので、P(Z<1.5)は、0.5+0.4332で探...続きを読む

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q確率変数とは

確率変数P{X=x}のXとxの違いがよく分かりません。というか確率変数の概念自体がよく分かりません。またなぜP{X=x}=P(x)なのかもわかりません。助けてください。

Aベストアンサー

まず、Xとxが紛らわしいですね。
P{X=x}=P(x)
を、
P{A=t}=f(t)
のように置き換えても、同じ意味ですので、こう置き換えて説明してみます。
確率変数というのは、最初に決めた、現象の集合と、実数との対応です。サイコロの例がよく出されますが、逆にわかりにくくしている面もあります。各面に、{a,b,c,d,e,f}という文字が書かれたサイコロを想像してみてください。さて、このサイコロで、{a,b,c}の文字が出る確率を知りたいとしますね。ところが、数学は「数」を扱う世界なので、文字は直接は扱えません。そこで、現象と数の対応を確率変数とします。この場合、確率変数Aを、
サイコロを振ってaが出たら、A=1
サイコロを振ってbが出たら、A=2
サイコロを振ってcが出たら、A=3
サイコロを振ってdが出たら、A=4
サイコロを振ってeが出たら、A=5
サイコロを振ってfが出たら、A=6
となる変数であると決めてしまいます。これで、現象->数への変換が出来ました。確率変数は、このように、本来数学では扱えない「現象の集合」を、数の集合に変換するのに使うのです。
P{A=t}のtは、正確に書くと、t∈実数です。つまり、実数を適当に一つ持ってきたのが、tです。
P{A=t}=f(t)は、現象の集合を確率変数Aで数に置き換えてやった時の値がtである確率が、f(t)という値と同じだよ。という意味です。

まず、Xとxが紛らわしいですね。
P{X=x}=P(x)
を、
P{A=t}=f(t)
のように置き換えても、同じ意味ですので、こう置き換えて説明してみます。
確率変数というのは、最初に決めた、現象の集合と、実数との対応です。サイコロの例がよく出されますが、逆にわかりにくくしている面もあります。各面に、{a,b,c,d,e,f}という文字が書かれたサイコロを想像してみてください。さて、このサイコロで、{a,b,c}の文字が出る確率を知りたいとしますね。ところが、数学は「数」を扱う世界なので、文字は直接は扱えません。...続きを読む

Q確率問題の計算式を簡単に教えてください

【問題】
50枚のスピードくじが有り、2枚が当りです。
5枚引いて当りの出る確率は何パーセントでしょう。

学校を卒業してから約20年。
ネットで検索して何とか回答を求めたのですが、自信が無いので、簡単に計算式と回答をお願いします。

自分が思うには、1/25+1/25+1/25+1/25+1/25=1/5
なのですがあっていますか?

Aベストアンサー

>1/25+1/25+1/25+1/25+1/25=1/5
これだと、25枚ひいたときには確率が1になり、必ず当たると言うことになりますよね。実際はそうはいきません。

「あたりが出る確率」の解釈は、「一枚も当たらない」の裏返し。1枚当たり、2枚当たりも含みます。

50枚の中から5枚を選ぶ組み合わせは、50C5、
48枚の中から5枚のはずれを拾う組み合わせは、48C5
よって、確率は、
1-48C5/50C5
=1- {(48*47*46*45*44)/(5*4*3*2*1)}/{(50*49*48*47*46)/(5*4*3*2*1)}
=1- (48*47*46*45*44)/(50*49*48*47*46)
=1- (45*44)/(50*49)
=0.19

Q標準正規分布表

正規分布について
標準正規分布表(上側確率や下側確率)を参考に

次の確率を求めなさい。
(①,④,⑤:小数第四位までで答えなさい
②~③:小数第三位までで答えなさい)
①ZがN(0、1)に従うとき、P(Z≧1.25)
② ZがN(0、1)に従うとき、P(Z≧z)=0.15となるz
③ ZがN(0、1)に従うとき、P( Z ≦z)=0.90となるz
④ ZがN(10、25)に従うとき、P(X≦7.5)
⑤ ZがN(10、25)に従うとき、P(16≦X≦18)

手も足も出ません、どういう意味で何を求めさせたい問題なのでしょうか?

Aベストアンサー

「手も足も出ません」って、正規分布を教科書で勉強している途上での問題ですよね?
 だったら、悪いことは言いません、もう一度教科書に戻って、出直した方が良いです。

 N(0、1)とかN(10、25)というのは、N(μ、σ^2)の意味であるということは理解していますか?
 μ:平均、σ:標準偏差、σ^2:分散 です。
http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

 「標準正規分布」とは、N(0、1)のことです。
 この標準正規分布表(上側確率や下側確率)が与えられているのですよね? だったら、それから読み取る、端数は補間して求めればよいのです。

①では、P(Z≧1.25)とは、分散の「1.25」倍より大きいところに分布する確率です。標準偏差にすると、プラス側(○○以上)とマイナス側(-○○以下)の両方があります。
正規分布では、±1σの範囲内に68.3%、±2σの範囲内に95.4%が入りますよね。
 ↓ こんな図を参照。
http://www.geisya.or.jp/~mwm48961/statistics/stddiv1.htm

以下同様。
④ ⑤では、N(0、1)になるように「X」を変換するステップが必要になります。

「手も足も出ません」って、正規分布を教科書で勉強している途上での問題ですよね?
 だったら、悪いことは言いません、もう一度教科書に戻って、出直した方が良いです。

 N(0、1)とかN(10、25)というのは、N(μ、σ^2)の意味であるということは理解していますか?
 μ:平均、σ:標準偏差、σ^2:分散 です。
http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

 「標準正規分布」とは、N(0、1)のことです。
 この標準正規分布表(上側確率や下側確率)が与えられているの...続きを読む

Q確率密度関数からの期待値の求め方

(たぶん?) 統計学の問題です。

xが(0≦x≦1)で一様に分布しているときの期待値E(x)の求め方を教えてください。

解説では、
確率密度関数f(x)=1(0≦x≦1)
E(x)=∫[1,0]x・f(x)dx
=∫[1,0]1・xdx
=[(x^2)/2][1,0]=1/2
([1,0]は∫の上に1がついて、下に0がついていました)
となっていたのですが、わたしは高校数学をやってこなかったので、解説を読んでもちんぷんかんぷんなんです…。

とくに確率密度関数が1となっている理由と、積分のやり方を教えていただけないでしょうか。

Aベストアンサー

>([1,0]は∫の上に1がついて、下に0がついていました)
通常は,[下限,上限]の順に書きます。 → [0,1] or [0→1] など。
[1,0] は逆です。

>積分のやり方を教えていただけないでしょうか。
この程度の積分が数学の微分積分の章や微積分の参考書の積分の最初の方に載っています。積分法は、きちんと学ぼうとすれば参考書や教科書一冊分以上の内容がありますので、ここで簡易に教えてもらって習得しようとするには無理があります。微積分の教科書や参考書を購入して、基礎から一通り学習された方がいいと思います。

確率密度関数 f(x) の性質
 ∫[-∞, ∞] f(x) dx =1 … (※)
確率分布関数は f (x) を使って 
 F(x)=∫[-∞, x] f(x) dx , F(∞)=1
で定義されます。

今の場合
>xが(0≦x≦1) で一様に分布しているとき

f (x)=k(定数)(0≦x≦1), f (x)=0 (その他のx) …(★) とおいて(※)の左辺に代入すると

 ∫[-∞, ∞] f(x) dx = ∫[-∞, 0] 0 dx + ∫[0, 1] k dx + ∫[1, ∞] 0 dx
   = 0 + [ kx] [0, 1] + 0
  = k (1-0) = k … (☆)

>とくに確率密度関数が1となっている理由

(☆)が、(※)の右辺の1に等しいから
  k = 1 … (◆)
とKが決まります。

これを(★)に代入すれば、「xが(0≦x≦1) で一様に分布している」場合の確率密度関数

 f(x) = 1 (0≦x≦1), f (x)=0 (その他のx) …(★)

>x が(0≦x≦1)で一様に分布しているときの期待値E(x)の求め方を教えてください。

期待値の定義式は

 E { x } = ∫[-∞, ∞] x f(x) dx

です。これに (★)のf(x)を代入すれば

 E { x } = ∫[-∞, ∞] x f(x) dx =∫[0, 1] x * 1 dx =∫[0, 1] x dx

積分公式:∫x^n dx = x^(n+1)/(n+1) + C (n=1) を適用して

  = [(1/2)x^2] [0, 1] = (1/2)*(1^2 -0^2) ] =(1/2)*1
  = 1/2

という結果が得られます。

>([1,0]は∫の上に1がついて、下に0がついていました)
通常は,[下限,上限]の順に書きます。 → [0,1] or [0→1] など。
[1,0] は逆です。

>積分のやり方を教えていただけないでしょうか。
この程度の積分が数学の微分積分の章や微積分の参考書の積分の最初の方に載っています。積分法は、きちんと学ぼうとすれば参考書や教科書一冊分以上の内容がありますので、ここで簡易に教えてもらって習得しようとするには無理があります。微積分の教科書や参考書を購入して、基礎から一通り学習された方がいいと思います。...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q標本分散と不偏分散の使い分けについて。

標本分散と不偏分散の使い分けについて。

私はメーカーに勤めており、電子部品のばらつきなどでよく標準偏差σを目にします。
自分で少し調べてみると標準偏差にも標本分散を使うときと不偏分散を使うときがあることを知ったのですが、説明が難しくどのように使い分けていいのか分かりません。

標本分散と不偏分散はどのように使い分ければいいのでしょうか。
例えば電子部品の性能や実験データのばらつきにはどちらが使われているのでしょうか?

ご存知の方、教えてください。
よろしくお願いします。

Aベストアンサー

 母集団から全ての標本を抽出して得た、すなわち、全てのデータを使った分散を標本分散、というようです。しかし、標本分散の文字から、抽出した標本の分散という意味から、不偏分散の意味でも使う(私もそうでした)こともあり、標本分散がどちらなのか、混乱しています。質問者も標本分散をこの意味で使っていると想います。

 母集団のデータを知るのが統計学では目的ですが、それには全数(全サンプル)を利用する必要があります。しかし、製品検査などでは、全数検査だと商品が残らない、あるいは手間がかかり過ぎるので抜き取りを行い、全数検査の替わりにできます。この場合の分散は、不偏分散で代用ができます、というのが推測統計学です。

 すなわち、全数検査(文字通り全数、一つ欠けてもダメ)なら標本分散(この用語は混乱を招くので、私は使いませんが)、抜き取りなら不偏分散を利用しています。


このQ&Aを見た人がよく見るQ&A

このカテゴリの人気Q&Aランキング