２つの母不適合品率の違いに関する検定と推定について

Question

はじめに自分の状況です。
製造会社に勤めており、自己啓発の為QC検定三級を取りました。ステップアップで二級の勉強を始めた所です。ですが統計学なんかちんぷんかんぷん…( ´_ゝ`)育児休暇中でまわりに質問出来る人は居ません。子どもがお昼寝した隙に少しずつ調べて勉強して居ますが時間だけが過ぎていきます。アホな質問かもしれませんが、どうか私に教えてください。
【２つの母不適合品率の違いに関する検定と推定について】 
２つラインで生産される部品がある。各ラインからそれぞれ500個のサンプルを抜き取り検査をした。Aラインでは10個、Bラインでは15個の不適合品があった。ラインによって母不適合品率に違いがあるか検討せよ。
↑テキストに出てくる例題です。解いて行くと、まず仮説を立てα＝5%とし、検定量の検定、棄却域の設定(両側検定-1.960、1.960)、統計値の計算をすると、ラインAは10/500＝0.02、ラインBは15/500＝0.03、2ラインでは25/1000＝0.025、検定統計量Ｚ＝(0.02-0.03)/√0.025(1-0.025)×(1/500＋1/500)＝ -1.013…となり判定は検定統計値Ｚ＝-1.013＞棄却限界値-1.960で帰無仮説は棄却されず、検定結果は有意でなく母不適合品率に差があるとはいえないとなります。そして母不適合品率の推定で点推定A-Bで0.02-0.03＝-0.01、信頼率95%の区間推定は-0.0293から+0.0093となります。
私が謎なのはAからBを引いてマイナスになった所です。もし仮にAラインで15個、Bラインで１０個の不適合のだった場合、検定はいいとして、差は同じなのに点推定はプラス0.01になるし、信頼区間も変わりますよね…( ´_ゝ`)？？もうアホな質問してるんだろうけどほんとに分からないんです。AラインBラインの差は同じなのに、点推定と信頼区間が変わる…何か基本的な事が分かっていないんだと思います。教えてください。

kamiyasiro · Accepted Answer

企業でSQCを推進する立場にある者です。博士(工学)です。

（文中の「不良」は、新JISに従い「不適合」と読み替えて下さい）

・ご質問の点ですが、差が正でも負でも問題の本質は変わりませんので、特に気にしないで下さい。符号を気にしなければならないのは片側検定のときで、棄却域をどちら側に取るかということになります。QC検定の付表の正規分布表は上側しか書いていないので、このケースでは絶対値で考えれば良いです。
・問題の本質というのは、「差」という１群の分布を考えている点です。差を取るという操作を何度も何度も行うと、毎回の差はある分布を持ちますが、その分布は「差の期待値は０」なので、０を平均値とした左右に広がる分布となります。だから正負があります。

・この分布のばらつきは、2つの正規分布があるとき、それらの和や差の分散には加法性があるという性質を使って求めます。和であっても差であっても分散は和ですので常に正です。

・今回サンプリングした「ある差」が、上で求めた分布の95％範囲にあれば、「ある差」は偶然であり、「差があった」とは考えないのです。

・この検定はz検定ですが、母分散未知であっても、次の理由からt検定ではなくz検定を行います。
・不良率の分布は二項分布です。二項分布において、npが大きい時はN(np,np(1-p))の正規分布に近似でき、これを直接近似法といいます。通常の平均値の差の検定とは異なり、このときの母分散は近似の上では確定していますので、母分散既知として扱うのです。

・ところが、不良率は非負の値であり、区間推定値が負値を取ることがある直接近似法は実務ではあまり使用されません。

・ここから先は、QC検定1級レベルになります。

・母比率の検定は、N(np,np(1-p))に直接近似する方法のほかに、修正ロジット値に変換してt検定を行う方法、逆正弦変換してからt検定を行う方法があります。後者の2つの方法は非負の前提で行うことができます。
・特に最後の逆正弦変換してからt検定を行う方法は、分散がpに依存しないので好ましい方法です。多くの統計ソフトが採用しています。というか、ご質問者がやってみえる直接近似はあくまで練習問題用で、実際にこの方法で計算するソフトはあまりありません。
・多くの企業で使われるStatWorksの母比率の検定もこの２つしかありません。

・t検定では自由度を考慮する必要があります。このときのサンプル数ですが、このような母比率の検定ではn数は各500個でなく、各々良品群・不良群と考え、全部でn=4群になります。言いかえれば、サンプル全部を使わずに、標本比率を使っているのです。標本比率は全部で4個の数値があるということです。
・ご質問者がされているz検定は自由度はありません。QC検定2級では、これでいいですが、1級になるとt検定をすべきかどうか微妙なところです。1級では逆正弦変換が出題されたことがあります。

・さらに、直接近似、ロジット変換、逆正弦変換は、いずれも近似であるので、不良率がゼロ漸近したときに精度が非常に悪化します。不良0％など0を含んでいる場合で、正確を期す場合は、フィッシャーの正確確率検定を行うと良いです。

stomachman · Answer

No.1へのコメントについてです。

「正確に」というのは、仮定した事を全部明示しろってことです。

> A=B

が意味するのは、「『Aライン』と『Bライン』は実はひとつのラインを指す二つの別名である」ということであって、

> (母不適合品率に差がない)

なんてことでは全くない。しかも「母不適合品率」の意味も定まっていません。

たとえば、
　「ある部品が不良になるという事象は、他の部品が不良になるという事象とどういう関係にあるのでしょうか？」
　「ある部品が不良になる確率は時間とともに変化するのでしょうか？  」
というような質問が出ないように、仮定を全部きちんと書くんです。その上で、「それらの仮定だけに基づいて、確率論をどう使って、検定すべき命題を導いたか」を示せば、ご質問の疑問は解消するでしょう。

…とか言っても質問者氏には無理っぽい感じがするので先回りして説明すれば、
　「Aラインにおいてある部品が不良になる事象」が独立であることから「Aラインにおいてある部品が不良になる確率」を不偏推定し、その確率分布が大数の法則によって正規分布で近似できることを使って、これとBラインにおける観察を比較したのか、それとも「Bラインにおいてある部品が不良になる事象」が独立であることから「Bラインにおいてある部品が不良になる確率」を不偏推定し、その確率分布が大数の法則によって正規分布で近似できることを使って、これとAラインにおける観察を比較したのか。

stomachman · Answer

「まず仮説を立て」と仰るその帰無仮説を正確に書いてみればすっきりすると思う。

２つの母不適合品率の違いに関する検定と推定について

企業でSQCを推進する立場にある者です。

No.1へのコメントについてです。

「まず仮説を立て」と仰るその帰無仮説を正確に書いてみればすっきりすると思う。

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング