プロが教える店舗&オフィスのセキュリティ対策術

割合を使用してt検定などができるのか・有意差があるのか調べることが可能なのかの質問です。

写真の様な表において、不良品の発生について2月と3月は有意差があるのかどうか調べたいです。
この場合にどうやって有意差を調べればいいのか教えてください。

単純に不良品数だけでt検定などをすると、有意差があると思います。
生産数が少ない2月と、生産数が多い3月では、元々の生産数が大きく異なるので有意差が発生してしまうと思います。

そのため不良品率でt検定を実施しようと思っていますが、割合を使用してt検定などは実施することは可能でしょうか?

聞きたいこと
1. 割合を使用してt検定などは実施することは可能かどうか。
2. 可能な場合はそのやり方を教えてください。
3. 不可能な場合は、この場合の2月と3月の不良品に関してどの様にして有意差の有無を調べればいいのか教えてください。

不躾で申し訳ありませんが、よろしくご教示ください。

「割合を使用してt検定などができるのか・有」の質問画像

A 回答 (1件)

何を調べたいのかにもよりますが、「不良率の変動」が一定範囲内に入っているか、不良率が他の日に比べて突出していないか、ということを調べたいのでしょうか。



そもそもの「母集団」(生産するものの全数)の不良率 p が分かっていて、その月の生産数 n があったとすれば、不良品の個数 X の期待値は
 E[X] = np   ①
になります。

不良品の個数は、「良品か、不良品か」の二項分布をしますから、その分散は、二項分布の性質から
 V[X] = np(1 - p)   ②
になります。

母集団の不良率 p は未知ですが、生産実績があるならそこから「推定」すればよいです。
お示しの例でいえば、6日間の総生産個数 89,500個、不良品の個数 960個ですから
 p' = 960/89500 = 0.010726・・・ ≒ 0.01073

もし「昨年の実績」などがあれば、そういったものから算出することも可能かと思います。

サンプル数(お示しの場合には「生産数」)が 1000以上あるのであれば、二項分布は「正規分布」で近似することができます。
(一般に、np>5 かつ n(1 - p) > 5 であれば正規分布とみなせる)

従って、何らかの検定をしたいのであれば、t分布ではなく、平均が①、分散が②の正規分布を使って行えばよいと思います。

二項分布

https://best-biostatistics.com/contingency/binom …


t分布は、母集団のパラメータ(例えば「長さ」や「重量」などの連続分布するもの)の平均、分散が未知の場合に、それを「サンプル」から推定する場合に使います。
お示しのような「良品か、不良品か」という「二値」の場合には、「二項分布」を使うのがよいと思います。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!