プロが教えるわが家の防犯対策術!

社内のあるデータを統計処理してみました。
正規分布はしていないようですが、おおよその値でCp値が1.5、Cpk値が0.7とでた場合はどう解釈したらよいのでしょうか?元々数字を扱う仕事には慣れていなくてPCが勝手に答えを出してくれるので便利なのですが、考察がついていきません。グラフ化してみると規格の上限付近に分布が偏っているようにも見えますがよく判りません。どなたか判りやすく説明いただけないでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (1件)

参考URLを見て下さい。


分かりやすい説明あります。

参考URL:http://homepage1.nifty.com/QCC/sqc4/sqc4-cpk.htm
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q正規分布に従わないと標準偏差の算出は向かないでしょうか?

正規分布に従うとは、平均値の分布が多いという意味でしょうか?

日々変わるデータの点数が凸のような分布でなく、平均値付近が少ない
凹のようなデータの集合だと、標準偏差を算出し正規分布を使い
30%以下の人や70%以上の人を毎日抽出するような用途には
向かないのでしょうか?

Aベストアンサー

まず、正規分布に従うとは、「分布が正規分布のグラフと同じ形をする事」をいいます。
そのため、平均辺りが多くても△のような分布グラフだったり、
左右が対象でないと、「正規分布に従う」とは言いません。

そのため、試験の成績などは、「正規分布に近い」だけであって、
「正規分布に従っている」のではありません。

つまり、「偏差値」を使うべきかどうかは、偏差値の「分かりやすさ」と、
その分布が正規分布に近いかどうかの判断になります。



例えば、凹のようなデータでも、両端がなだらかになっていれば、そこそこ偏差値も使えます。

逆に、両端が崖のようになっていると、偏差値を使うのは控えた方がいいでしょう。
(たとえば、30点や、80点の人は多いけど、29点以下や、81点以上がいないなど)

また、分布が左右対称でない場合も、使用をやめた方がいいでしょう。
平均値と、中央値(順位が真ん中の人の値)が離れると、偏差値の感覚的な値とは
ずれてきます。



いずれにしても、ある程度のデータがあるのであれば、そのデータで
やってみるのが一番です。

出るべき結果と大きなずれがなければ、分かりやすいので使ってしまっても
いいのではないでしょうか。

試験の結果なんかでも、山が二つあったり、左右に偏っている事なんて
よくあります。

それでも、偏差値が、それなりに機能していますから、まずはやってみるのが
いいのではないかと思います。

まず、正規分布に従うとは、「分布が正規分布のグラフと同じ形をする事」をいいます。
そのため、平均辺りが多くても△のような分布グラフだったり、
左右が対象でないと、「正規分布に従う」とは言いません。

そのため、試験の成績などは、「正規分布に近い」だけであって、
「正規分布に従っている」のではありません。

つまり、「偏差値」を使うべきかどうかは、偏差値の「分かりやすさ」と、
その分布が正規分布に近いかどうかの判断になります。



例えば、凹のようなデータでも、両端がなだら...続きを読む

Q統計的工程管理

仕事で工程管理の勉強を始めました。
基礎的な用語なんですけど分かりません、教えてください。
(1)工程能力指数のCpとCpkとの違いが分かりません。どちらも同じ意味なのでしょうか?
(2)PpとPpkは何を意味するのでしょうか?

教えて下さい、宜しくお願します。

Aベストアンサー

(1) Cpは工程能力指数(Process Capability Index)のことで、工程でのデータ分布と規格との数的関係を表したものです。通常、
Cp=(上限規格値-下限規格値)/6s
    s=工程データの標準偏差
で計算されます。
ただし、このCpはデータの分布の中心(=平均値)が上限規格値と下限規格値の中央にあることが前提となっていて、ズレは考慮されていません。
そこで、平均値が上下規格の中心からずれている(=かたより)場合に用いる指標として、Cpkが作られました。

Cpk=(1-K)Cp

  |平均値-(規格上限値+規格下限値)/2|
K=--------------------------------------
   (規格上限値+規格下限値)/2

  |・・|は絶対値

です。したがって、偏りがない場合(平均値が上下規格値の中央と一致)はK=0で、Cp=Cpkですが、ズレが大きいほど、工程能力指数は下がります。

(2) Ppは工程性能指数(Process Performance Index)といわれ、アメリカのGMなどが提唱するQS9000という規格で使われているものです。
QS9000では、上記のCpの式で計算したものをPpと呼びます。ではCpはどうなるのかというと、上記式のsの部分が Rbar/d2 となります。これはX-R管理図から求めるもので、統計上、郡内変動を表します。これに対して、Ppはデータの標準偏差を使うところに違いがあります。
PpkはCpkと同様で、
Ppk=(1-K)Pp
Kの計算は上記と同じです。

QS9000では工程管理の一貫として管理図を使うことが書かれているため、管理図から工程能力指数を出そうとしたようです。そのため、工程管理でわかる工程能力とサンプリングデータによる工程能力を分ける意味で、PpとCpを作ったようです。

ちなみに、どの指数も、1以下では工程能力がないと判断され、QS9000では2以上が目標とされます。

(1) Cpは工程能力指数(Process Capability Index)のことで、工程でのデータ分布と規格との数的関係を表したものです。通常、
Cp=(上限規格値-下限規格値)/6s
    s=工程データの標準偏差
で計算されます。
ただし、このCpはデータの分布の中心(=平均値)が上限規格値と下限規格値の中央にあることが前提となっていて、ズレは考慮されていません。
そこで、平均値が上下規格の中心からずれている(=かたより)場合に用いる指標として、Cpkが作られました。

Cpk=(1-K)Cp

  |平...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q3σ法による計算式

当方、管理や統計学など全く無知ですのでわかりやすく教えて下さい。

仕事で、管理図を作成するにあたり、3σ法で管理限界線(UCL,LCL)を計算せよとの事を言われましたが、理解出来てません。

3σ法の公式とかあるんでしょうか?あったら教えて下さい。あと、3σとは何か、簡単に教えて下さい

Aベストアンサー

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため)
4)それを、(データの数-1)で割る(気持ちとしては、ばらつきの量を平均した感じ・データの数-1で割るのは、「母標準偏差の推定」という考え方があるから)
5) 3)でばらつきを2乗しているので、それをルートで開いて元に戻す

とうことになります。

統計上いくつかの前提があって、例えば、製造工程で普通にものを作った場合、いろいろなばらつきは、それぞれ独立に出ます。
そこで、結果的には、ある一定の平均値付近のものが多くでき、平均値から外れたものは、少しだけどできるという形になる場合が多いのです。
この場合、誤差が本当の意味での「ばらつき」であれば、これは、「正規分布」という分布(つまり、平均値付近が多く、それから離れると少なくなっていくような)をします。

この「正規分布に従う」という前提で、平均値±3σの間には、全体の、99%強 が含まれるというのが、統計的に知られています。
これを以て、3σで管理という事になります。


さて、「管理図」ということですが、いろいろな種類のものがあります。
そこで、普通は、UCL, LCL は、製品自体の規格値(か、それから算出された値)を使うので、直接、3σは出てこない気がするのですが。
考えられるのは、x-s (平均と、標準偏差の管理図)で、標準偏差に対する上限管理値が3σなのかなと。(この場合、下限の管理値はありません。0が理想なので)

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため...続きを読む

QJIS/ISO規格に基づくサンプル数の考え方・決め方

部品の温度上昇に関する試験依頼がありました。
サンプル数については依頼がありませんでしたが、
ISO規格、JIS規格等に基づく根拠を明確にして
説明することが求められています。

ISO規格、JIS規格に基づくサンプル数の決め方、計算方法、
根拠等についてアドバイスいただきますようお願い申しあげます。

Aベストアンサー

以下に詳細がありますのでご覧下さい。
http://homepage1.nifty.com/QCC/2003-3.html
http://aql.blog19.fc2.com/blog-entry-15.html

業務なら
「JIS Z 9015」そのものをご覧になられては
いかがでしょうか?


人気Q&Aランキング