標準正規分布の確率を求める時の、半整数補正について

Question

とある問題で、
「N(np, npq)に従う確率変数Xについて」
「10人以上、20人未満の確率を求めよ」
とありました

標準化するために直す時に、10人以上は、9.5以上、にした方が精度が上がるらしいので（半整数補正）、
Z=(9.5-np)/σ
で確率を求めているのですが、

20人未満の確率は、
20人以上の確率の排反、として
Z=(20-np)/σ
その時の確率pを1-pする

としていました

半整数補正は10人以上の時はしているのに、20人以上の時はしていませんよね

ある程度大きな数字はしなくてもよいのでしょうか？
それとも、常にしておいた方がよいのでしょうか？

よろしければお願い致します

yhr2 · Accepted Answer

No.1です。典型的な「二項分布」ですね。サンプル数が 400 もあるので、十分に正規分布で近似できると思います。

二項分布の「半整数補正」は、正規分布が「連続関数」であるのに対して、二項分布の度数分布が「階級値」の階段状になるため、階級値の境界を範囲とすることにより、精度を上げようとする方法です。

この問題の場合、「10人以上、20人未満」なので、「10人以上、19人以下」ということと等価です。
その意味では、「半整数補正」をするなら「9.5人 ～ 19.5人」にするのが妥当かと思います。一方だけ補正して、他方は補正しないというのは、むしろ精度を落とすように思います。
おそらく、質問者さんの感覚が正しいのではないかと思います。

yhr2 · Answer

No.2です。試しにやってみれば、

期待値：Ex = 400 * 0.045 = 18
　分散　：Vx = 400 * 0.045 * (1 - 0.045) = 17.19
　標準偏差：σ = √Vx = 4.14608･･･ ≒ 4.15

z=(10 - 18)/4.15 ≒ -1.93　→　P(z≦-1.93) = 0.026803
z=(9.5 - 18)/4.15 ≒ -2.05　→　P(z≦-2.05) = 0.02018

z=(20 - 18)/4.15 ≒ 0.482　→　P(z≧0.48) = 0.315614
z=(19.5 - 18)/4.15 ≒ 0.361　→　P(z≧0.36) = 0.359424

確率は、下記の「標準正規分布表」から読み取りました。
https://staff.aist.go.jp/t.ihara/normsdist.html

以上より
　P(400, 10<X<20) = 1 - 0.026803 - 0.305614 ≒ 0.668
　P(400, 9.5<X<20) = 1 - 0.02018 - 0.305614 ≒ 0.673
　P(400, 9.5<X<19.5) = 1 - 0.02018 - 0.359424 ≒ 0.620

これらの値をどう扱うか、ということですが、P(400, 9.5<X<20) の値を使うということは、「できるだけ確率として救い上げる」「確率を大きめに評価する」（漏れがないようにする）という意図かなあ、と思います。
それがこの場合求められているのかどうか、そのように評価するのが妥当か、ということまでは分かりません。

yhr2 · Answer

全く問題の意味が分かりませんが、単に
　10「以上」なので「 9.5 より大きい」に
　20「未満」なので 20.5 以下ではなく「 20 より小さく」に
しているだけでは？

おそらく、確率変数 Ｘ を「整数の人数を含む範囲」にするために、そういう補正が必要なのでは？
全体の「分布」がどうなっているのか分からないので、何とも言えませんが。

標準正規分布の確率を求める時の、半整数補正について

No.1です。

No.2です。

全く問題の意味が分かりませんが、単に

似たような質問が見つかりました

このQ&Aを見た人はこんなQ&Aも見ています

関連するカテゴリからQ&Aを探す

このQ&Aを見た人がよく見るQ&A

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング