アプリ版:「スタンプのみでお礼する」機能のリリースについて

とある問題で、
「N(np, npq)に従う確率変数Xについて」
「10人以上、20人未満の確率を求めよ」
とありました

標準化するために直す時に、10人以上は、9.5以上、にした方が精度が上がるらしいので(半整数補正)、
Z=(9.5-np)/σ
で確率を求めているのですが、

20人未満の確率は、
20人以上の確率の排反、として
Z=(20-np)/σ
その時の確率pを1-pする

としていました

半整数補正は10人以上の時はしているのに、20人以上の時はしていませんよね

ある程度大きな数字はしなくてもよいのでしょうか?
それとも、常にしておいた方がよいのでしょうか?

よろしければお願い致します

質問者からの補足コメント

  • 補足ですが、np(平均)の単位は(人)です

      補足日時:2017/08/07 19:18
  • うーん・・・

    問題は、
    「国民の症状の割合p=0.045の症状について、母集団400人の集団について、400人のうち、症状がある人数が10人以上20未満の確率を求めよ」です
    B(400, 0.045)を正規分布に近似するとN(18, 4.14^2)

    ここから標準化をしてz=(9.5-18)/4.14
    とz=(20-18)/4.14
    として、その確率の差をとっています

    10人以上の標準化は9.5にしているのに、20人以上の標準化は20のままなのは何故かな、と思いました
    20未満の確率p=1-{20人以上の確率p}としているようですので、20人以上の標準化なら、19.5にしないといけないのでは、と思いました

    No.1の回答に寄せられた補足コメントです。 補足日時:2017/08/07 20:50

A 回答 (3件)

No.1です。

典型的な「二項分布」ですね。サンプル数が 400 もあるので、十分に正規分布で近似できると思います。

二項分布の「半整数補正」は、正規分布が「連続関数」であるのに対して、二項分布の度数分布が「階級値」の階段状になるため、階級値の境界を範囲とすることにより、精度を上げようとする方法です。

この問題の場合、「10人以上、20人未満」なので、「10人以上、19人以下」ということと等価です。
その意味では、「半整数補正」をするなら「9.5人 ~ 19.5人」にするのが妥当かと思います。一方だけ補正して、他方は補正しないというのは、むしろ精度を落とすように思います。
おそらく、質問者さんの感覚が正しいのではないかと思います。
    • good
    • 1

No.2です。

試しにやってみれば、

 期待値:Ex = 400 * 0.045 = 18
 分散 :Vx = 400 * 0.045 * (1 - 0.045) = 17.19
 標準偏差:σ = √Vx = 4.14608・・・ ≒ 4.15

z=(10 - 18)/4.15 ≒ -1.93 → P(z≦-1.93) = 0.026803
z=(9.5 - 18)/4.15 ≒ -2.05 → P(z≦-2.05) = 0.02018

z=(20 - 18)/4.15 ≒ 0.482 → P(z≧0.48) = 0.315614
z=(19.5 - 18)/4.15 ≒ 0.361 → P(z≧0.36) = 0.359424

確率は、下記の「標準正規分布表」から読み取りました。
https://staff.aist.go.jp/t.ihara/normsdist.html

以上より
 P(400, 10<X<20) = 1 - 0.026803 - 0.305614 ≒ 0.668
 P(400, 9.5<X<20) = 1 - 0.02018 - 0.305614 ≒ 0.673
 P(400, 9.5<X<19.5) = 1 - 0.02018 - 0.359424 ≒ 0.620

これらの値をどう扱うか、ということですが、P(400, 9.5<X<20) の値を使うということは、「できるだけ確率として救い上げる」「確率を大きめに評価する」(漏れがないようにする)という意図かなあ、と思います。
それがこの場合求められているのかどうか、そのように評価するのが妥当か、ということまでは分かりません。
    • good
    • 0
この回答へのお礼

ありがとうございました。

お礼日時:2017/08/08 23:30

全く問題の意味が分かりませんが、単に


 10「以上」なので「 9.5 より大きい」に
 20「未満」なので 20.5 以下ではなく「 20 より小さく」に
しているだけでは?

おそらく、確率変数 X を「整数の人数を含む範囲」にするために、そういう補正が必要なのでは?
全体の「分布」がどうなっているのか分からないので、何とも言えませんが。
この回答への補足あり
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています