dポイントプレゼントキャンペーン実施中!

とある製品Aの品質管理をしております。
製品Aの測定結果を連続で100個取得した結果正規分布となりました。その正規分布と標準偏差を使用して3σ管理を行いたいと思いました。
しかし、
測定20個目で製品Aの測定値は3σを超えました。
測定30個目でも製品Aの測定値は3σを超えました。

3σを超えるのは1000個のうちたった3つですよね?既に30個の段階で3σを2つ超えたのはなぜだと思いますか。

ご教師ください。

質問者からの補足コメント

  • どう思う?

    ご回答ありがとうございます。
    20個目や30個目の段階では、まだサンプルサイズが小さいため、統計的なばらつきが大きく影響を与えている可能性があります。とありますが、

    標準偏差を決めるときのサンプル数が100個では足りなかったということも考えられますか?

    No.2の回答に寄せられた補足コメントです。 補足日時:2024/06/23 11:58
  • うーん・・・

    ご回答ありがとうございます。
    では今回の例は、標準偏差を得たデータ数が(100個のサンプル)少なすぎて、3σ外れが多発しても不思議ではない。という理解でよろしいですか。

    No.5の回答に寄せられた補足コメントです。 補足日時:2024/06/23 16:55
  • 画像を添付する (ファイルサイズ:10MB以内、ファイル形式:JPG/GIF/PNG)
  • 今の自分の気分スタンプを選ぼう!
あと4000文字

A 回答 (7件)

No.7です。



予測区間は、100個のサンプルから計算しますので、t値は、

t(0.99865,99)=3.077524

ですね。
勘違いしていました。

すみません。

ただし、サンプル分散+平均値分散 は忘れずに。
    • good
    • 0

> 標準偏差を決めるときのサンプル数が100個では足りなかった?



足りないことはありません。
多くのメーカーでは、工程能力指数を計算するときはn=100のサンプルで計算せよ、と定めています。

これよりn数が少ないと、標準偏差は小さめになります。

そのため、c4補正という補正が行われます。

(母標準偏差)=σ/c4 ここでσはサンプルの不偏分散から求めた標準偏差

c4(30)=0.9914181
c4(100)=0.9974780 ・・・補正不要

> なぜ越えるか?

今の現象は、No.6様が書かれているように、予測区間に平均値分散(σ^2/n)が考慮されていないことに加え、t分布であることを考えていないからです。

ご質問者様がやりたいことを理論通りにやるならば、
①分散の加法性から「サンプル分散+平均値分散」を求め、
②その平方根にt値(t(0.99865,φ=19)=3.4472,あるいはt(0.99865,φ=29)=3.280397)を掛けた値を予測区間としなければなりません。

そのまま、従来の±3σ内に入るなんてことは絶対にありません。

n=30(φ=29)でも、t値は±3.280397です。つまり、予測区間は±3より広くなっています。
    • good
    • 0

No.5 です。

「補足」について。

>今回の例は、標準偏差を得たデータ数が(100個のサンプル)少なすぎて

いいえ。「標準偏差」だけでなくて、「平均値」の方が大きいです。
100個のデータから得た「平均値 Xbar、不偏分散 s^2」に対して、母集団の平均値 µ の「信頼度 99%(有意水準 1%)信頼区間」は
  Xbar - 2.36√(s^2/100) ≦ µ ≦ Xbar + 2.36√(s^2/100)
程度になります。

想定する正規分布の平均値自体が、この程度の不確実さを持ちます。

ご参考

https://bellcurve.jp/statistics/course/8972.html


>3σ外れが多発しても不思議ではない

「不思議」かそうでないかは、確率で論じることになります。
どんなに低い確率であっても起こり得ます。
どんな宝くじでも、必ず「1等当選者」がいます。
それに当たるのが「不思議」かどうかは、その確率が「極めて小さい」かどうかで論じることになり、「極めて小さい」を「いくつに設定するか」で決まります。
上に書いた「信頼度 99%(有意水準 1%)」は、その「極めて小さい」を「確率1%(=0.01)以下」にしたということです。
    • good
    • 0

質問者さんは重大な誤解をしています。


「連続で100個取得した結果正規分布となりました。その正規分布と標準偏差を使用して3σ管理を行いたい」
としていますが、そこで使う「平均値、標準偏差」は、あくまで「100個のサンプル」のものであって、未知の母集団(たとえば製品を1万個、100万個作ったとき)の平均、標準偏差とは異なります。

実際の製品(母集団)を管理するためには、「100個のサンプルのデータ」から、未知の母集団の平均、標準偏差を推定しなければなりません。
たった1つの「100個のサンプル」自体が、母集団に対して統計的な誤差を持っていますから、製品(母集団)の「平均値」は「100個のサンプルの平均値」の周りの「信頼区間」の範囲のどこかにあると推定するのが普通です。(信頼区間の幅は「信頼度、有意水準」などによって変わります)
その上で、製品の不良が「上側に外れる」か「下側に外れる」のかを考慮して(たとえば、食品であれば、重量オーバー(記載値よりも多い)ならOK、重量不足(記載値より少ない)のはNGなど)、管理すべき「平均値」を決める必要があります。
また、母集団の「標準偏差」も、「100個のサンプル」そのものの分散ではなく、そこから得られる「不偏分散」から推定するのが普通です。

つまり、「100個のサンプルのデータ」から作った「管理値」では統計誤差を含むので、それを排除した管理値を作らないといけないということです。

それをいちいち計算して求めるのは大変なので、いろいろな日常的な「工程管理」の手法や「シックスシグマ」手法などというものがあるのでしょう。

また、仮に「99.7%」だとしても、一定の確率で「20個目に不良」「30個目に不良」は起こり得ます。それが「統計的なバラツキ」ですから。
たくさんの(理論的には無限個の)「1000個のサンプル」を採ってきたときの平均が「3個」ということです。その3個が「何番目に現われるか」もまた千差万別です。
この回答への補足あり
    • good
    • 0

品質管理では、製品1個1個の値を管理するということはありません。

それは検査です。20個なら、n=20の抜き取り検査です。JISの検査通則に従い処置して下さい。

品質管理では、平均値管理をします。製造工程が正しく維持されているかどうかを、工程平均が維持されているかどうかで判断します。

20個でも30個でも、平均値が維持されていなければ、直ちに是正処置を行うべきです。逆に1個だけ外れていても平均値が正常なら、たまたま1個だけの問題です。

管理図は、1日4点の測定値を元に平均値を打点します。その平均値が前月の平均値の±3σ内に入っているかどうか(もちろん、他の指標もありますが)が、管理のポイントです。

xbar管理図で群間の変動を、R管理図で群内の変動を管理しています。
    • good
    • 0

私も 品質管理や工程管理や作業改善をやってきましたが...


あたまでっかちの理論屋には悩まされましたね。

>既に30個の段階で3σを2つ超えたのはなぜだと思いますか。
実際の工程(か何か)を見てますか? 
3σ管理 で 大事なのは 「原因を分析して対策を講じる必要があり」です。 統計的な処理をいくらやっても「悪い現象をとりのぞかなければ」なんお価値もありません。

>1000個のうちたった3つですよね
もう、そんな考えが時代遅れかなと思います。1000個で不良0じゃなきゃ、今の時代に生き残れませんよ。

不良が一個でも出たら、原因を突き止めて対策するんです。
    • good
    • 0

製品Aの測定結果が正規分布に従っている場合、3σ範囲内に約99.7%のデータが含まれることを意味します。

 つまり、1000個のうち約997個は3σ範囲内に収まるはずです。

サンプルサイズ:
20個目や30個目の段階では、まだサンプルサイズが小さいため、統計的なばらつきが大きく影響を与えている可能性があります。 サンプルサイズが増えると、正規分布に近づくことが期待されます。

外れ値:
測定値が3σを超える場合、外れ値が含まれている可能性があります。 外れ値は正規分布の仮定に反するため、統計的な解析に影響を与えます。
測定値が外れ値であるかどうかを確認し、必要に応じて除外することを検討してください。

測定プロセスの安定性:
測定プロセス自体が安定しているかどうかも考慮する必要があります。 測定器の精度や再現性、環境の影響などが測定結果に影響を与える可能性があります。
この回答への補足あり
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!