はじめに自分の状況です。
製造会社に勤めており、自己啓発の為QC検定三級を取りました。ステップアップで二級の勉強を始めた所です。ですが統計学なんかちんぷんかんぷん…( ´_ゝ`)育児休暇中でまわりに質問出来る人は居ません。子どもがお昼寝した隙に少しずつ調べて勉強して居ますが時間だけが過ぎていきます。アホな質問かもしれませんが、どうか私に教えてください。
【2つの母不適合品率の違いに関する検定と推定について】
2つラインで生産される部品がある。各ラインからそれぞれ500個のサンプルを抜き取り検査をした。Aラインでは10個、Bラインでは15個の不適合品があった。ラインによって母不適合品率に違いがあるか検討せよ。
↑テキストに出てくる例題です。解いて行くと、まず仮説を立てα=5%とし、検定量の検定、棄却域の設定(両側検定-1.960、1.960)、統計値の計算をすると、ラインAは10/500=0.02、ラインBは15/500=0.03、2ラインでは25/1000=0.025、検定統計量Z=(0.02-0.03)/√0.025(1-0.025)×(1/500+1/500)= -1.013…となり判定は検定統計値Z=-1.013>棄却限界値-1.960で帰無仮説は棄却されず、検定結果は有意でなく母不適合品率に差があるとはいえないとなります。そして母不適合品率の推定で点推定A-Bで0.02-0.03=-0.01、信頼率95%の区間推定は-0.0293から+0.0093となります。
私が謎なのはAからBを引いてマイナスになった所です。もし仮にAラインで15個、Bラインで10個の不適合のだった場合、検定はいいとして、差は同じなのに点推定はプラス0.01になるし、信頼区間も変わりますよね…( ´_ゝ`)??もうアホな質問してるんだろうけどほんとに分からないんです。AラインBラインの差は同じなのに、点推定と信頼区間が変わる…何か基本的な事が分かっていないんだと思います。教えてください。
No.3ベストアンサー
- 回答日時:
企業でSQCを推進する立場にある者です。
博士(工学)です。(文中の「不良」は、新JISに従い「不適合」と読み替えて下さい)
・ご質問の点ですが、差が正でも負でも問題の本質は変わりませんので、特に気にしないで下さい。符号を気にしなければならないのは片側検定のときで、棄却域をどちら側に取るかということになります。QC検定の付表の正規分布表は上側しか書いていないので、このケースでは絶対値で考えれば良いです。
・問題の本質というのは、「差」という1群の分布を考えている点です。差を取るという操作を何度も何度も行うと、毎回の差はある分布を持ちますが、その分布は「差の期待値は0」なので、0を平均値とした左右に広がる分布となります。だから正負があります。
・この分布のばらつきは、2つの正規分布があるとき、それらの和や差の分散には加法性があるという性質を使って求めます。和であっても差であっても分散は和ですので常に正です。
・今回サンプリングした「ある差」が、上で求めた分布の95%範囲にあれば、「ある差」は偶然であり、「差があった」とは考えないのです。
・この検定はz検定ですが、母分散未知であっても、次の理由からt検定ではなくz検定を行います。
・不良率の分布は二項分布です。二項分布において、npが大きい時はN(np,np(1-p))の正規分布に近似でき、これを直接近似法といいます。通常の平均値の差の検定とは異なり、このときの母分散は近似の上では確定していますので、母分散既知として扱うのです。
・ところが、不良率は非負の値であり、区間推定値が負値を取ることがある直接近似法は実務ではあまり使用されません。
・ここから先は、QC検定1級レベルになります。
・母比率の検定は、N(np,np(1-p))に直接近似する方法のほかに、修正ロジット値に変換してt検定を行う方法、逆正弦変換してからt検定を行う方法があります。後者の2つの方法は非負の前提で行うことができます。
・特に最後の逆正弦変換してからt検定を行う方法は、分散がpに依存しないので好ましい方法です。多くの統計ソフトが採用しています。というか、ご質問者がやってみえる直接近似はあくまで練習問題用で、実際にこの方法で計算するソフトはあまりありません。
・多くの企業で使われるStatWorksの母比率の検定もこの2つしかありません。
・t検定では自由度を考慮する必要があります。このときのサンプル数ですが、このような母比率の検定ではn数は各500個でなく、各々良品群・不良群と考え、全部でn=4群になります。言いかえれば、サンプル全部を使わずに、標本比率を使っているのです。標本比率は全部で4個の数値があるということです。
・ご質問者がされているz検定は自由度はありません。QC検定2級では、これでいいですが、1級になるとt検定をすべきかどうか微妙なところです。1級では逆正弦変換が出題されたことがあります。
・さらに、直接近似、ロジット変換、逆正弦変換は、いずれも近似であるので、不良率がゼロ漸近したときに精度が非常に悪化します。不良0%など0を含んでいる場合で、正確を期す場合は、フィッシャーの正確確率検定を行うと良いです。
とても丁寧に、そして親切に教えて頂きありがとうございます。一人で勉強していると教えてもらえる事の有難さを感じます。おかげで納得いかなかった所がスッとした感じです。勉強を始めたばかりでロゼッタストーンの解読状態ですが( ´_ゝ`)実務でもしっかり使えるように努力していこうと思います。
貴重なお時間を割いて頂きありがとうございました。kamiyasiroさんに幸運が訪れますように!
No.2
- 回答日時:
No.1へのコメントについてです。
「正確に」というのは、仮定した事を全部明示しろってことです。
> A=B
が意味するのは、「『Aライン』と『Bライン』は実はひとつのラインを指す二つの別名である」ということであって、
> (母不適合品率に差がない)
なんてことでは全くない。しかも「母不適合品率」の意味も定まっていません。
たとえば、
「ある部品が不良になるという事象は、他の部品が不良になるという事象とどういう関係にあるのでしょうか?」
「ある部品が不良になる確率は時間とともに変化するのでしょうか? 」
というような質問が出ないように、仮定を全部きちんと書くんです。その上で、「それらの仮定だけに基づいて、確率論をどう使って、検定すべき命題を導いたか」を示せば、ご質問の疑問は解消するでしょう。
…とか言っても質問者氏には無理っぽい感じがするので先回りして説明すれば、
「Aラインにおいてある部品が不良になる事象」が独立であることから「Aラインにおいてある部品が不良になる確率」を不偏推定し、その確率分布が大数の法則によって正規分布で近似できることを使って、これとBラインにおける観察を比較したのか、それとも「Bラインにおいてある部品が不良になる事象」が独立であることから「Bラインにおいてある部品が不良になる確率」を不偏推定し、その確率分布が大数の法則によって正規分布で近似できることを使って、これとAラインにおける観察を比較したのか。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
対数グラフ用紙に収まらない場...
-
極値をもつ時と持たない時、単...
-
エクセルのグラフから半値幅を...
-
EXCELにてローパスフィルタを作...
-
物理学実験のグラフの描き方に...
-
卒業論文のアンケートの数について
-
カイ二乗検定
-
数Ⅲの問題です 数直線上を運動...
-
(統計学)有意傾向がある場合...
-
エクセルの統計でχ二乗検定の結...
-
騒音値の「90%レンジの上端」...
-
SPSS出力の「Boxの共分散行列の...
-
心理学の統計について
-
検量線の決定係数について
-
理科のグラフで、直線と曲線の...
-
x=2分の3のグラフはどのように...
-
エクセルで正規分布かどうかを...
-
データが正規分布しているか判...
-
二つのデータの分散からブール...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
カイ二乗検定
-
エクセルのグラフから半値幅を...
-
統計について
-
検量線の決定係数について
-
3群の比較にχ二乗検定を使う場...
-
【統計】有意に「高い」?「低...
-
エクセルの統計でχ二乗検定の結...
-
ノンパラメトリック検定の多重...
-
パーセンテージの平均値2標本の...
-
パイロットサンプルって何ですか?
-
二次関数の問題です 二次関数 y...
-
理科のグラフで、直線と曲線の...
-
心理機能診断をしたのですが、...
-
アンケートの集計分析の基礎(...
-
変化率のみで、有意差の検定は...
-
検定統計量の値がマイナス
-
極値をもつ時と持たない時、単...
-
最小二乗法を反比例の式を元に...
おすすめ情報