「お昼の放送」の思い出

統計学の参考書でわからない問題があったので、解答と解き方を教えていただきたいです。
初心者のため、かなり基礎的なものかもしれませんが、よろしくお願いします。

ある生産工程では、製品の10%の不良品が出ると言う。この製品の仕切りから無作為に400個取り出すとき、次の問いに答えよ。なお、標本の大きさは十分大きいとみなしてよい。
⑴50個以上不良品が含まれる確率を求めよ。
⑵不良品の数が40−cから40+cの範囲にある確率が0.9となるようなcの値を定めよ。

A 回答 (1件)

「製品の10%の不良品」なので、400個の標本の中の不良品の「期待値」(不良品の出現する平均値)は


  400 * 0.1 = 40 個
です。しかし、必ず40個というわけではなく、40個を中心に「何らかの分布」をするということです。
 どういう分布かといえば、良品である確率 0.9、不良品である確率 0.1 の「二項分布」をします。

 つまり、400個のうち、k個が不良品である確率は
  P(k) = 400Ck * (0.9)^(400 - k) * (0.1)^k
ということになります。

 二項分布における不良品の期待値、分散は
  E = 400 * 0.1 = 40
  N = 400 * 0.1 * 0.9 = 36
です。
 標準偏差は「分散」の平方根なので
  標準偏差 σ=√36 = 6

 詳細は、こんなサイトを参考に。
https://ja.wikipedia.org/wiki/%E4%BA%8C%E9%A0%85 …

 二項分布は、サンプル数が大きければ「正規分布」に近づきます。「標本の大きさは十分大きいとみなしてよい」ということは、つまり「正規分布」とみなしてよいということです。

 「正規分布」の特性は、テキストには必ず書いてあります。
http://www.stat.go.jp/koukou/howto/process/p4_3_ …

 標準偏差を「σ」として、
  期待値(平均値)± σ の範囲に、全体のデータの 68.3% が入る
  期待値(平均値)±2σ の範囲に、全体のデータの 95.4% が入る
  期待値(平均値)±3σ の範囲に、全体のデータの 99.7% が入る
あるいは「有意水準=危険率(←→信頼度)」を基準にして
  期待値(平均値)± 1.65σ の範囲内に、全体のデータの 90.0% が入る
  期待値(平均値)± 1.96σ の範囲内に、全体のデータの 95.0% が入る
  期待値(平均値)± 2.57σ の範囲内に、全体のデータの 99.0% が入る
ということです。

(1)不良品が50個以上ということは、期待値=40 ですから
  (50 - 40)/σ = 10/6 ≒ 1.67
 つまり、
  期待値(平均値)+ 1.67σ 
ということです。これはつまり、上に書いた ± 1.65σ とほぼ等しいので
  40 ± 1.67σ
範囲に全体の約 90% が入るということです。ということは、これを外れた範囲には
  40 + 1.67σ = 50個 以上の範囲に 5%
  40 - 1.67σ = 30個 以下の範囲に 5%
の合計10%が存在します。

 従って、50個以上不良品が含まれる確率は「約 5%」です。

(2)これも、(1)に書いたのと同じですね。
 c = 10個
です。
 標準偏差 6 に対して 1.65σ = 9.9 ≒ 10 ということです。
    • good
    • 0
この回答へのお礼

二項分布まではたどり着けていたのですが、正規分布と近似に思い至りませんでした。
とてもわかりやすい解説ありがとうございましたm(_ _)m

お礼日時:2016/12/07 16:19

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報