平均値±3σについて

締切済

質問者：dejimono11
質問日時：2008/09/27 11:22
回答数：3件

データが正規分布に従うとき、平均値±3σの範囲内に99.7％のデータが入るというところまでは理解できています。ここで、正規分布を適用するためには、母分散が既知の場合という条件が付きますが、実際問題として母分散が未知の場合がほとんどなので、正規分布ではなくｔ分布を使わなければならない気がします。そうなると、信頼区間は平均値±定数×標準偏差S×√ｎとなりますので、例えば工程管理等で平均値±3σを利用する意味がイマイチ理解できません。3σのσも、実測値から計算したものならSと表記すべきな気もします。
的外れな質問かもしれませんが、詳しい方がおられましたら、ご教示のほどよろしくお願いします。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (3件)

最新から表示
回答順に表示

No.3

回答者： Ishiwara
回答日時：2008/10/02 11:52

現実問題として「データの分散」と「母分散の不偏推定値」と「母分散そのもの」は、表記上かなり混用されています。

これらは「s」「σの＾付き」「σ」と書き分けるべきですが、実務上混乱がなければ、混用も許される場合があります。しかし「s」と「σの＾付き」は、もともと大きさが違うことにもご注意ください。

なお、Ａ２の話は、範囲（データの最大値と最小値の差）を統計量とするものですから、σとはやや縁が薄くなると思います。

- 0
- 件

通報する

No.2

回答者： km1939
回答日時：2008/10/02 10:20

母標準偏差（σ）未知の場合の平均値の信頼区間の推定に関する質問だと

　　思います。

　信頼区間は質問者さんの平均値±定数（t(φ、α）)×標準偏差σ×√n
です。ここで平均値±３σを利用する意味がわからないと言う質問だと
　思います。
　
　　±３σ（９９．７％）か±２σ（９５％）のどちらかで管理するかは
　　その工場の方針で決まることで、２σと３σでは信頼区間つまり
　　平均値の管理幅が違います。

　　

- 2
- 件

通報する

この回答へのお礼

ご返信ありがとうございます。
±３σに設定しているのは、管理幅を広く取って、第一種の過誤が小さくなる様にし、管理幅から外れたら、明らかに異常であると言えるようにするためですね。

通報する

お礼日時：2008/10/02 23:26

No.1

回答者： rabbit_cat
回答日時：2008/09/28 11:45

ｎ→∞で、ｔ分布は正規分布に一致します。

実際問題、n=無限大でなくても、n=100になれば正規分布との誤差は１％程度です。
ここで、誤差１％といってるのは、正規分布で「平均値±3σの範囲に99.7％」に対して、n=100にｔ分布では、「平均値±2.97Sの範囲に99.7％」てことです。
普通、サンプリング調査では１００個ぐらいは取るでしょうから、実用的には、正規分布として扱ってもほとんど問題ないのでは。

この回答への補足

質問の仕方がまずかったです。すいません。
正規分布かｔ分布かというよりは、標本平均から、「平均値±定数×標準偏差÷√ｎ」により、母平均の区間推定をするはずなのに、「平均値±3σ」から母集団が推定できるとすると、これは母集団の分布そのものなり、標本平均から母集団のデータの区間推定をできるのか？と疑問に思い質問しました。
統計学の書籍で確認したところ、３シグマは、管理図で用いられている考え方で、上の式の定数＝3とし、式を変形していくと、管理限界線が平均値±A２Rバーとなりるそうです。（ここで、A2は、n数によって異なった値をとる定数。）
母集団からn個のサンプルをとって、標本の平均、分散から母平均を予想する式は、あくまで「平均値±定数×標準偏差÷√ｎ」であり、「平均値±3σ」は、母平均を求める計算式ではなく、母集団が99.7％入るときの定数が３であること、標本平均から母分散を推定するときの定数にすぎないことがわかりました。

補足日時：2008/10/01 00:20

通報する