一回も披露したことのない豆知識

データ数(N数)が少ない場合の工程能力を求める際、標準偏差を補正したいです。調べたところ下記2つの方法があるようなのですが、どちらが正しい考え方なのでしょうか。使い分け等あれば教えていただきたいです。補正方法(1)のほうが(2)に比べて補正係数が大きく(信頼区間にもよりますが)、その意味するところの違いも教えていただきたいです。

できれば、実用面からエクセルでの計算例もあるとありがたいです。

※下名の知識レベルとしては、学生時代に一度統計学の講義を受けた程度でほとんど忘れています。


補正方法(1)(・・・計算方法はわかりました)
 標本から求めた標準偏差をχ二乗分布で区間推定し、
 母集団の標準偏差とのずれを補正する
  ※参考URL:http://ouenblog.divaandco.com/?eid=940571

補正方法(2)(・・・合っているかだけでなく、計算方法も不明)
 標準偏差の不偏推定量D(Wikipediaより)を直接使い、標本の標準偏差との差を補正する。
 具体的には、不偏分散u^2にはエクセルにおけるSTDEV関数で求めた標準偏差を代入し、
 ガンマ関数の部分はGAMMALN関数内に自由度÷2、データ数÷2を入れて計算する?
  ※参考URL:http://ja.wikipedia.org/wiki/%E6%A8%99%E6%BA%96% …
  →"統計値の標準偏差"の上から5番目の式

統計学は難しいですね・・・
ご回答よろしくお願いします。

A 回答 (1件)

 「標準偏差の補正」と仰るのは、(a)単に母集団の標準偏差を推定したいのか、(b) 標準偏差の信頼区間の上限・下限(つまり「最悪」どこまで大きい可能性があるか・「最良」どこまで小さい可能性があるか)を計算したいのか。

どっちなのかをまずはっきりしてもらわんと。

 (a) 「最もありそうな結果」を推定したいという話。
 母集団の標準偏差を使ってCpkを計算すれば良い訳ですが、その母集団の標準偏差の推定には、「普通」は母集団の分散の不偏推定を行って、その平方根を使う。しかしうるさい事を言えば、平方根y=√xが非線形変換であるために、微妙な補正が必要になる(「補正方法(2)」に該当)。ただし、分散の不偏推定値が持つ相対誤差が小さい時には、y=√xをその接線で近似しても誤差が少ないので、補正はほとんど効かない。だから、そんな手間は掛けないのが「普通」。

 (b) 「最悪(最良)どうなるか」を推定したいという話。(「補正方法(1)」に該当。)
 たまたまサンプルのばらつきが実力以上に小さかった場合(実力よりばらついていた場合)に、(a)の方法で推定した母集団の標準偏差は真値より小さい(大きい)ことになるんで、それを使って計算したCpkは実力以上に良い(悪い)ことになる。なので、得られたサンプルから予測される最も悲観的(楽観的)な母集団の標準偏差は(そしてCpkは)幾らか、ということを推定しようということ。ただし、最悪(最良)とは言いながら、実際には信頼区間を勝手に設定した上での上限・下限を使うしかない。

> 補正方法(1)のほうが(2)に比べて補正係数が大きく

 両者は全然別の目的で別のことをやっているのであり、比べるのは無意味。これは統計学が難しいという話じゃなくて、「一体何のために計算をやってるのか」を忘れちゃいけない、というだけのアッタリマエのことです。
    • good
    • 6

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


おすすめ情報