重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

【GOLF me!】初月無料お試し

異なる集団の標準偏差を比較する

統計学に詳しい方、お知恵を貸してください。

ある製品の検査データについて検討しています。
「製造されてから検査されるまでの日数」と「寸法の収縮(mm)の標準偏差」を散布図にプロットし、日数と標準偏差との間に相関関係があるか・相関関係があれば一次式で表すことが出来るかを調べています。Excelで計算したところ、R^2が0.13と小さな値になりました。
そこで個々の標準偏差同士に統計上有意な差があるか否か判定したいのですが、どのような手法を使えば判定できるでしょうか?同僚からは「t検定を使えばよかったような気がする」と言われたのですが、本当にそれで良いのかイマイチよく分かりません。
比較しようとしている標準偏差は全て別のロットの製品のものです。

最終的な目的は、「出荷前の製品からある程度の数を抜き取って検査し、その最大値から6σを引いた値を製品全体の最小値と推定する」ことです。要は全体の最小値が知りたいのです。(推定した最小値が規格下限値を下回るかどうかが知りたい。)
そのσを規定するために、「σが日数によって変化するのか(σが日数の関数なのか)、日数が変わっても統計的にはσが変わらないのでσを定数としていいのか」を判定したいです。

長くなりましたが、統計学に詳しい方ご教授して頂けないでしょうか。
(「最大値から6σを引いて最小値を推定する」というのは上司が考えたアイデアなのですが、最小値を推定する方法としてもっと相応しい方法があればそれもご教授して頂きたいです。)
宜しくお願いします。

質問者からの補足コメント

  • 抜き取り検査で得られたσから最小値を推定するのではなく、「製造から検査までの日数〇〇日の場合はσ=△△として最小値を推定する」という規格を作り、そのσの値を使って最小値を推定したいです。

      補足日時:2017/09/28 21:02

A 回答 (1件)

1.最終目標につながるご説明になっていないような気がするので、何をなさりたいのかイメージがつきません。


加えて、登場するデータがどんなデータなのかがわかりません。

2.散布図を書いて決定係数を求められていますが、散布図は釣鐘型の二次関数や波型の三次関数以上の関数にはなっていませんか?

3.「個々の標準偏差同士に統計上有意な差があるか否か判定したい」とのことですが、「標準偏差=ばらつき」なので、分布のばらつきを比較するのであればF検定になると思います。

4.最小値を推定するのであれば、極値分布の推定か、欠損値の推定になるのかなと思います。
https://en.wikipedia.org/wiki/Generalized_extrem …
https://www.slideshare.net/shuyo/observational-s …

5.私なら、4は面倒なので、最小値の平均の信頼区間を用いるかなと思いました。
つまり、各ロットの最小値データを代表値として収集→代表値の平均と標準偏差を使って代表値平均の信頼区間を推定→代表値平均の信頼区間の下限値を推測される最小値とみなす、というステップでお手軽に決めてしまうと思います。
    • good
    • 1
この回答へのお礼

ご回答ありがとうございます。

1.データに関しては機密になる恐れがあるので具体的には書きませんでした。もうしわけありません。

2.散布図はおおよそ直線上に並んでいますので、一次関数での近似が適当かと思います。ただ、近似直線からはかなりバラついて(幅を持って)分布しているので、近似すること自体が適当なのか疑問に思い、質問致しました。

3. 4. 「F検定」「極値分布」「欠損値」これらのキーワードで調べてみます。リンクありがとうございます。

5. この方法も上司に提案してみます。

具体的なアドバイスを下さりありがとうございました。

お礼日時:2017/10/04 20:07

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!