最新閲覧日:

ある集団の体重の分布は、平均値60㎏、分散8²㎏に従う正規分布である。
このとき、無作為に抽出した2人の体重差が4㎏を超える確率を求めるにはどうすればよいですか?
正規分布について、正規化することや標準正規分布の読み取は出来ます。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

#1です。



>感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

について、2つの説明をします。

①モンテカルロ・シミュレーション
N(60,8^2)に従う正規乱数を2個作って、
それらの差の絶対値が4を超えたらカウントするという操作を
10万回繰り返し、全体に占める割合を算出しました。
以下は、Rというフリーの統計ソフトのスクリプトです。

counter <- 0
iterate <- 0
while(iterate < 100000){
x1 <- rnorm(1,60,8)
x2 <- rnorm(1,60,8)
counter <- counter + ifelse(abs(x1 - x2) > 4,1,0)
iterate <- iterate + 1
}
counter / iterate

結果は、 0.72165 でした。
前にお示しした計算値に近い値になりました。

②正規分布に従う無作為標本のレンジ(範囲)Rの期待値
n個の無作為標本の範囲はどんな値になるか。
品質管理には、次のような式があります。
σ=R/d2
n=2のとき、d2≒1.12838
σ=8 なので、よって、R=8×1.12838=9.02704
つまり、σ=8の集団から得られるn=2の標本は、
平均的には約9の範囲があるのです。
4以上の開きが出るのは、違和感が無いというより、
むしろ当然なのです。
    • good
    • 0
この回答へのお礼

再度の質問にも丁寧に答えていただき感謝します。
良く分かりました。ありがとうございました。
もう少し基本的なことから学びなおします。

お礼日時:2016/12/15 06:33

分散 8² ということは、標準偏差が 8 (kg) ということはよいですね?



2人の体重差 (X1 - X2) の分布は、X1、X2 の各々が N(60, 8²) に従うので
 平均値 = 60 - 60 = 0
 分散:σ² = 8² + 8² = 128
ということになります。この場合の標準偏差は
 σ = √128 ≒ 11.3 (kg)  ←要するに 8 (kg) * √2
になります。

従って、 体重差 4 kg は
  4/ 11.3 ≒ 0.354σ
ということになります。

ということで、N(0, 11.3²) で分布する「体重差」が 0 ± 4 kg (平均値 ± 0.354σ ) の外側になる確率を求めればよいのです。

この確率は、標準正規分布表から(例えば下記)から、Z=0.35 を読み取って「0.3632」、Z=0.36なら 「0.3594」。
これが「片側確率」なので、「両側確率」は、おおよそ
  0.36 * 2 = 0.72
ということです。

標準正規分布表
https://staff.aist.go.jp/t.ihara/normsdist.html

>感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

 どのような根拠でそう考えるのですか?
 そもそもが N(60, 8²) で分布しているので、体重差が確実に 4 kg 以下というのは平均値付近で見れば、2人とも
 60 ± 2 kg
ということなので、これが
 平均値 ± (1/4)σ
であることから、この範囲に入るのは 0.2 程度の確率です。なので、体重差が 4 kg を越える確率が 0.72 というのは、それほど違和感はないように思います。
    • good
    • 0
この回答へのお礼

詳細なご説明ありがとうございます。
良く分かりました。

お礼日時:2016/12/15 06:32

分散の加法性の問題です。



x1もx2もN(60,8^2)に従いますので、
x1-x2は分散の加法性により、N(0,128)に従います。

このとき、差が4を超えるのは、4/√128・σ外の時だから、
それを計算して、±0.3535σ
この両側裾野確率は0.7236736

一瞬、ドキっとする問題ですが、冷静に考えれば、
テキストに出てくる練習問題と同じです。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
補足質問よろしいですか?
この両側裾原確率0.7236736が4kgを超える確率ですか?
感覚的に、4キロを超える確率が0.72...というのは高すぎるような気もするのですが。

お礼日時:2016/12/14 18:31

このQ&Aに関連する人気のQ&A

このQ&Aと関連する良く見られている質問

Q正規化と標準正規分布

ある試験で10名の点数は以下のとおりであった。(写真)
「連続正規分布するとして、65点以下の人がいる確率は何%か?」
期待値が50、標準偏差が10.95445と分かったのですが、65点以下の人がいる確率とはどう計算すれば求まるでしょう?

Aベストアンサー

正規分布の基本的な性質を理解されていますか?

下記サイトにあるように、標準偏差を σ と書いて
・平均値 ± σ の範囲に、全体の 68.3% が入る。
・平均値 ± 2σ の範囲に、全体の 95.4% が入る。
という分布です。
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm

σ = 10.95 ということなら(信用して検算はしません)、「65点」は
 平均値 + 1.37σ
( 50 + [ (65 - 50)/10.95 ]*σ )
ということですから、標準正規分布表(例えば下記。テキストの巻末などに必ず載っているはず。平均値=0、σ=1 に規格化した正規分布)より、Z=1.37 となる確率(斜線の面積)を読み取ると
 0.4147
なので、これが「50~65点の人の確率」ということです。
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm

 標準正規分布表の「平均値以下」(問題の場合には 0~50点の人の確率)の確率 0.5 と合わせて、

  65点以下の人確率 = 0.5 + 0.4147 ≒ 0.915

ことになります。
(表から、「60点以下」の確率を足し合わせると「0.9」になるので、「65点以下」ならこれより少し大きいことが想定されますから、感覚的にもこんな値でよさそうですね)


 正規分布の基本的な特性(標準偏差の何倍の範囲内に、全体のどれだけが含まれるか)と、標準正規分布表の読み方という、「統計の基本中の基本」を問うている問題ですので、しっかり復習して理解してください。

 先に出て来る「サンプルから母集団の推定」とか「検定」なども、この考え方に基づくものですから。
(「有意水準」5%とは、平均値の両側に「95%」が存在する「1.96σ」の範囲を計算することになる)

正規分布の基本的な性質を理解されていますか?

下記サイトにあるように、標準偏差を σ と書いて
・平均値 ± σ の範囲に、全体の 68.3% が入る。
・平均値 ± 2σ の範囲に、全体の 95.4% が入る。
という分布です。
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm

σ = 10.95 ということなら(信用して検算はしません)、「65点」は
 平均値 + 1.37σ
( 50 + [ (65 - 50)/10.95 ]*σ )
ということですから、標準正規分布表(例えば下記。テキストの巻末などに必ず載っているはず。平均値=0、σ=1 に規...続きを読む

Q統計学 正規分布

以下の問題が分かりません。

XがN(20,5^2)に従っているとき、上側5%点と四分位点を求めよ。

よろしくお願いします。

Aベストアンサー

「四分位点」は、上から「四分位」の点でよいのでしょうか。通常は、下から25%が「第1四分位点」、上から25%が「第3四分位点」と呼ばれることが多いですが。

まずは、「正規分布」の分布のしかたは理解していますね?

下記サイトにあるように、標準偏差を σ と書いて
・平均値 ± σ の範囲に、全体の 68.3% が入る。
・平均値 ± 2σ の範囲に、全体の 95.4% が入る。
という分布です。
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm

これは「標準偏差の n 倍」を基準にした見方ですが、「全体の○○%」の方を基準に「5%」「25%」にすればよいわけです。
ただし、「上から5%」「上から25%」ということは
(a) 上側5%点:平均値 ± n1*σ の範囲に、全体の 90.0% が入るときの n1
(b) 四分位点:平均値 ± n2*σ の範囲に、全体の 50.0% が入るときの n2
という n1, n2 を求めることになります。

これを下記のような「標準正規分布表」から読み取ると、これは「上半分」だけの表なので、
http://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm

(a) 表の中の記載値が 0.45 になるのは、見出しの Z=1.64と1.65の中間ぐらい →Z=1.645 ←これがn1
(b) 表の中の記載値が 0.25 になるのは、見出しの Z=0.67と0.68の中間ぐらい →Z=0.675 ←これがn2
と読み取ることにしましょう。

もともとの正規分布が N(20,5^2) つまり「平均値=20, σ=5」ということですから、
(a) に相当する値:上側5%点
 20 + 5 * 1.645 = 28.225 ≒ 28.2
(b) に相当する値:第3四分位点(上から25%のX)
 20 + 5 * 0.675 = 23.375 ≒ 23.4

(b) がもし「第1四分位点」(下から25%のX)だとしたら、n2 をマイナスにして
 20 - 5 * 0.675 = 16.625 ≒ 16.6
になります。

「四分位点」は、上から「四分位」の点でよいのでしょうか。通常は、下から25%が「第1四分位点」、上から25%が「第3四分位点」と呼ばれることが多いですが。

まずは、「正規分布」の分布のしかたは理解していますね?

下記サイトにあるように、標準偏差を σ と書いて
・平均値 ± σ の範囲に、全体の 68.3% が入る。
・平均値 ± 2σ の範囲に、全体の 95.4% が入る。
という分布です。
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm

これは「標準偏差の n 倍」を基準にした見方ですが、「全体の○○%...続きを読む

Q正規分布の確率密度関数

画像のような問題で、定数kと分散の値は出せたのですが、平均の導き方がどうしてもわかりません。
助けて頂けると嬉しいです!

Aベストアンサー

#3です。企業に勤務する統計家です。

今日のお昼休みに、実際に解いてみました。
そうしたら、②の平均の導出がヒントとなって、
③の分散が、#2さんの「2次の中心積率」で簡単に解けることが分かりました。

#3での、#1さんへの指摘「前に出る定数e^1/2は分母になるのでは?」は、
私の勘違いでした。お詫びします。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

【問】k*exp(-x^2/2-x)が正規分布の確率密度関数のとき、
定数k,平均,および分散を求めよ。

①「密度関数は、-∞から∞まで積分した時に1になる」を使う。
ガウスの積分公式を使うため、まずネイピア数の指数を平方完成する。

(与式)=k*exp(-1/2*(x^2+2*x))
=k*exp(-1/2*(x+1)^2+1/2)
=k*exp(1/2) * exp(-1/2*(x+1)^2)

ガウスの積分公式∫e^(-at^2)dt=sqrt(π/a) より、

∫(与式)dx=k*exp(1/2) * sqrt(2*π) 積分区間は-∞から∞まで

k*exp(1/2) * sqrt(2*π)=1  と置くと、

∴k=1/(exp(1/2)*sqrt(2*π))

②与式は正規分布と指定されていることから、平均は与式を微分して0と置いて求める。
なぜなら、正規分布関数は、確率密度が一番高い所が平均だから。

(k*exp(-x^2/2-x))´
=k*exp(-x^2/2-x) * (-x^2/2-x)´
=k*exp(-x^2/2-x) * (-x-1)

これを0と置くと、前の項は指数関数で0にならないから、
(-x-1)=0
x=-1

∴E(x)=-1

③分散は2次の中心積率から求める。

V(x)=∫(x-(-1))^2*(与式)dx   積分区間は-∞から∞まで

②より、(与式)=(与式)´/-(x+1) となることに着目

V(x)=∫(x-(-1))^2*(与式)dx
=-∫(x+1)^2/(x+1)*(与式)´dx
=-∫(x+1)*(与式)´dx
=-((x+1)*(与式)-∫(x+1)´*(与式)dx)     ・・・部分積分を適用
=-(x+1)*(与式)+∫(与式)dx

第1項は(-1,0)を中心とした回転対称になる奇関数なので積分値は0。
第2項は確率密度の全範囲積分だから1。

∴V(x)=1

#3です。企業に勤務する統計家です。

今日のお昼休みに、実際に解いてみました。
そうしたら、②の平均の導出がヒントとなって、
③の分散が、#2さんの「2次の中心積率」で簡単に解けることが分かりました。

#3での、#1さんへの指摘「前に出る定数e^1/2は分母になるのでは?」は、
私の勘違いでした。お詫びします。

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

【問】k*exp(-x^2/2-x)が正規分布の確率密度関数のとき、
定数k,平均,および分散を求めよ。

①「密度関数は、-∞から...続きを読む

Q共分散の計算

甲氏は、自己資金でA証券とB証券に投資することを考えている。A証券とB証券の投資収益率の関係は過去なデータから次のように想定している(写真の表)

この問題の、共分散の求め方を教えてください。

Aベストアンサー

共分散は、たとえばこちらに定義が載っています。テキストにも載っているでしょう?
https://ja.wikipedia.org/wiki/%E5%85%B1%E5%88%86%E6%95%A3
http://mathtrain.jp/covariance

ただし、質問の表の見方がよく分かりません。
(A証券, B証券) の組合せデータが9個あり、その各々の出現率が表の数値ということですか?

Q統計学 多変数の確率分布

以下の問題が分かりません。

2つの確率変数X, Y に対して, E[max(X,Y )] = E[X] + E[Y ]−E[min(X,Y )]が成り立つことを示せ。

よろしくお願いします。

Aベストアンサー

> 右辺第3項を移項すると、左辺はE[X+Y]になる。
> E[X+Y]=E[X]+E[Y]の証明問題に帰着される。
これは、論理の展開がおかしいです。

任意の確率変数について、
E[X+Y]=E[X]+E[Y]  … (☆)
ということを事実を使って、はじめて右辺第3項を移項すると、左辺がE[X+Y]になることを言えるわけです。

実際やってみれば、右辺第3項を左辺に移項して、
E[max(X,Y)] + E[min(X,Y)]
= E[max(X,Y) + min(X,Y)]
= E[X + Y]

1行目から2行目への変形で、(☆)を使っています。

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報