【先着1,000名様!】1,000円分をプレゼント!

このカテゴリーでいいのかわかりませんが職場である分析をしてその結果に対して
どう考えていいか統計的手法を用いて証明したいのですがよくわかりません。
初心者でもわかるように詳しい説明をしていただけないでしょうか。宜しくお願いします

分析結果より、上限規格の30個以上には まずならないというのを統計的手法を用いて証明して
欲しいと上司から言われています。結果だけを見ても超える事はないと一目でわかりますが。


分析結果から得られた情報として n=69 σ=3.7  平均=4.0  max=14  min=0

上記の結果が得られて上限の規格を30以下とした場合、自分なりに考えてみました。(下限は考えなくてもいいです。より0に近いほうがいいので無視して下さい)

(1)3σの幅で 3×3.7=11.1  平均が4.0なので4.0+11.1=15.1になります。
 よって。3σは99.7%が3σにおさまるので(1000個だと997個がok、残り3つが不良)と考えられる
ので上限規格の30以下を考えると30を超えるのは極めて少ないという結論でよろしいでしょうか?
6σでみても6×3.7=22.2  4+22.2=26.2になるので26.2個が100%に限りなく近くおさまっている
と考えていいのでしょうか?

(2)工程能力指数で片側 (30-4.0)/3√3.7=Cp= 4.48となり工程能力指数も十分満足しており
 30個は超える事がないと考えていいのでしょうか?そもそもここで工程能力指数をだしても
無意味でしょうか?

(3)その他何か推定とか検定して30個は超えないということが証明できるか又は
 上記の統計結果から上限はいくらぐらいになるか(1)の他に推定とかは出来るでしょうか?

自分の考えとしては(1)と(2)で30個を超えることはないとこれで証明できると思うのですが
そのあたりがよくわかりません。

どなたか詳しい方、指導の程、宜しくお願いします。
  

このQ&Aに関連する最新のQ&A

A 回答 (6件)

補足を見て気付きました。



データは2000個(10g)が一まとめのものを1サンプルとし,
69サンプルを作り、それに付いて着色粒子の数を数えた。

その結果が、ポアソン分布に近くなる可能性は高いですが、
<σ=3.7  平均=4.0  max=14  min=0>
からλ=4で議論を進めたのは早とちりでした。

69個のサンプルの内、着色粒の無いサンプルの個数が1番多い
のでは?
そして着色粒の数が多い裾がだらだらと14個まで伸びているのでは?
この場合λが1,2に近くなりますが、平均も分散も共に理論値のλ=k=1,2
より大きくなります。
外れが大きくなると、ポアソン分布を想定した議論は無意味になります。
正規分布を想定した議論がベースを失うように。

分布を想定しない議論の提案も有りますが、一般には確率は悪い方向に
動くので、シビアな品質問題への適用は難しいでしょう。
それにデータベースとの関連で説明もさらに難しくなります。
データーベースが有りながらユーザー(上司)への説明で「データーは
さておいて、数学の理論では云々」では「なぬ?!」と言う反応が来ることが
予想されます。

2000個中40個と解釈すべきか、2000回で40回と考えるべきかは混乱中です。

まずデータを精査され、どの分布に従うか、またはどんな関数で近似できるのか
を検討されることをお勧めします。
データとヒストグラムを写真添付して再質問されたらいかがでしょうか。
学問教育の欄にはよく出かけます。
    • good
    • 0
この回答へのお礼

drmurabergさん貴重なお時間をさいて頂きありがとうございます。

そもそも自分が質問するときにもと詳しく書いてデータも合わせて添付するのが

本当ですね。たび重ねてお詫びします。一度データを整理してみたいと思います。

しかしdrmurabergさん統計にすごく詳しいですね。うらやましいです。

この機会に少しでもと思いいろいろ勉強します。ありがとうございました。

お礼日時:2012/01/14 19:08

訂正


<Px=∫P(X=k)dk= =∫λ^k*exp(-λ)/k!dk>

kの積分ではなく、kとλを固定して得られた曲線のグラフの
Xが3σ以上の部分の面積です。

離散的な数字ですので、横軸の離散数に付いての和を取っても良いでしょう。
横軸の0以上の数字は(数表から)
X= 0, P=0
X= 1, P=0.01533
X= 2, P=0.09022
X= 3, P=0.16803
・・・・・・・
X=11, P=0.01019
X=12, P=0.00531
X=13, P=0.00269
X=14, P=0.00133
X=15, P=0.00065

Pの和 X1~X15=0.99956
Pの和X11~X15=0.02017
Px=0.02017/0.99956=0.0202

つまり、この場合3σ以上の粒の個数は
Nex=N*0.0202となります。
10/wが1000なら20個です。

検算はお任せします。

余談ですが、
宇宙からの放射線がカウンターに入る時間間隔がポアソン分布に従います。
間隔ほぼゼロで来るのも希、長い時間来ないのも希だからです。
ガイガーカウンタで測って解析させられました。
それ以外では、航空機事故の起こる間隔がこの分布に従うとされています。
  

この回答への補足

何度も申し訳ないです、理解できずに。1g=200粒 で10gで2000粒です。(実測値の平均)

重さが1粒0.005g(5mg)

10/wが2000粒の場合は3σ以上の面積の部分が40粒になるということでしょうか?

理解が出来なくてすいません。3σ以上の部分の色が付いた粒が40粒?

なんかますますわからなくなってきました。こんなに詳しく説明してもらっているのに理解力

がなくて申し訳ありません。

補足日時:2012/01/14 17:18
    • good
    • 0

チェビシェフの不等式によると


http://ja.wikipedia.org/wiki/%E3%83%81%E3%82%A7% …
任意の分布に対して、3σの範囲内に全体の8/9が含まれることになります。

>3σは99.7%が・・・
の部分を「3σは88.8%が」、と置き換えれば、どんな場合でも問題なく通用します。
    • good
    • 0
この回答へのお礼

foomufoomuさんありがとうございます。チェビシェフの不等式 はじめて耳にしました。

まだまだわからない事が沢山あります。勉強になります。3σが88.8%ですか。

ありがとうございました。

お礼日時:2012/01/14 15:28

No.1への補足で納得がゆきました。



69回サンプルを10gずつ取り、着色した粒の数を数えた訳ですね。
着色した粒の出現が希な場合はポアソン分布で表されるのは
納得できます。

まずサンプルに含まれる粒数が30個のベースになります。
1粒の平均重さをw(g)とすると、サンプル中の粒の平均個数Nは
N=10(g)/w(g) 個
となります。

データの分布がポアソン分布
P(X=k)= λ^k*exp(-λ)/k!
に従うとすると
k=4.0,λ(=σ)=3.7での値はP=0.19279
k=4.0,λ(=3σ)=11.1での値はP=0.00956
となります。

3σより大きな物の占める割合Pxは
Px=∫P(X=k)dk= =∫λ^k*exp(-λ)/k!dk   積分範囲は3σ~∞
となります。(P(X=k)は0~∞で1に規格化してある。)

着色粒の期待個数Nexは
Nex = N*Px
でこれが30個よりどれだけ小さいかが判断の根拠になります。

分布がポアソン分布とは違う場合は、データから近似曲線を得て、
それを数値(または図上で)積分することも考えられます。

この回答への補足

drmuraberg さんありがとうございます。なかなか理解できず今ポアソン分布を調べて

いるのですが、ホアソン分布にあてはめて計算すると 30粒になる確率は

0.00000000000000008%の確率で限りなく0に近いことになるのでしょうか?(エクセルの関数で計算)


あまりにも高度すぎて理解できてないです。すいません。

補足日時:2012/01/14 16:28
    • good
    • 0

残念ながらお考えの方法ではできないと思います。



<分析結果より、上限規格の30個以上には まずならないというのを
統計的手法を用いて証明>という言葉を
<分析結果より、1,000個中で上限規格(3σ)を越える物の個数は30を遙かに下回る事を
統計的手法を用いて証明>と理解してよろしいでしょうか?

3σの論法で基本的に間違っているのは、<σ=3.7  平均=4.0  max=14  min=0>
の分布は正規分布とは程遠い事です。
したがって正規分布を使ったお考えの論は何の意味も持ちません。

分布形はポアソン分布に似たものになると思います。
http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2% …

ポアソン分布の場合、平均=分散ですから、この図のλ=4に近いように思えます。
(λが十分大きい場合、正規分布となります。)

これを手許のデータでご確認の上で、上限公差を3σとした場合の、ポアソン分布での出現確率を
考えられる様お勧めします。

この回答への補足

drmurabergさんアドバイスありがとうございます。統計に無知で情けないです。

No.1のokormazd さんも言っておられる正規分布にはならないので3σでの自分の考えでは

無理のようですね。安易に考えていました。

上限規格が30以下でデータからも全て30以下になっているのでこれでいいのかと思いましたが
難しいですね。

ポアソン分布ですか。これで一度調べてみます。簡単に出来るものなのでしょうか。


分析結果より、1,000個中で上限規格(3σ)を越える物の個数は30を遙かに下回る事を
統計的手法を用いて証明>と理解してよろしいでしょうか?

ここは自分の考えではデータの結果より 30以上にはならないというのを証明したかったです。

データの取り方はNO.1さんの補足で書きました通りです。

頭の中がごちゃごちゃになってきました。すいません。

補足日時:2012/01/14 13:13
    • good
    • 0

どのようなものの統計かはわかりませんが、データが変ではないでしょうか。



n=69 σ=3.7  平均=4.0  max=14  min=0

では、正規分布からは遠い様な気がするので、これを正規分布モデルで考えるのは適当ではないのではないでしょうか。
「0に近いほうがいい」というなら、平均が「0」に近く、データも負の値があるのが妥当だと思うのですが、どうでしょう。
二項分布なのでしょうか。データの取得とモデルを検討したほうがいいのではないでしょうか。

また、「上限規格の30個以上」という意味も分かりません。nが大きくなれば、規格を超えるものも多くなるはずですよね。

もう少し、どんなものについて、どうやって得たデータなのかわからなければ、「統計的手法を用いて証明」などできないと思いますが。私の勘違いならご容赦を。

この回答への補足

okormazdさん、さっそくのアドバイスありがとうございます。説明も悪く統計にも詳しくなくて
すいません。10グラム粒を計ってその中で色の付いた粒を数えてデータを取ったものです。

データは粒を数える方法でその中の色が付いているものを数えます。その色の付いた粒の数(個数)が
規格は30以上ではなくて 30以下です。なので色のついてない粒もあるので0のものも多数あります。
それで平均が4粒ということです。ですから負の値はないのです。(最小が0個になります)

この色の付いたものが悪い粒とお考え下さい。色のついてないものが良い粒です。
色の付いてない粒が0が理想なんですが。これで色の付いている粒の規格が10gの中に30個以下
というのが規格です。

これでどうでしょうか?宜しくお願いします。

補足日時:2012/01/14 12:39
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q3σ法による計算式

当方、管理や統計学など全く無知ですのでわかりやすく教えて下さい。

仕事で、管理図を作成するにあたり、3σ法で管理限界線(UCL,LCL)を計算せよとの事を言われましたが、理解出来てません。

3σ法の公式とかあるんでしょうか?あったら教えて下さい。あと、3σとは何か、簡単に教えて下さい

Aベストアンサー

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため)
4)それを、(データの数-1)で割る(気持ちとしては、ばらつきの量を平均した感じ・データの数-1で割るのは、「母標準偏差の推定」という考え方があるから)
5) 3)でばらつきを2乗しているので、それをルートで開いて元に戻す

とうことになります。

統計上いくつかの前提があって、例えば、製造工程で普通にものを作った場合、いろいろなばらつきは、それぞれ独立に出ます。
そこで、結果的には、ある一定の平均値付近のものが多くでき、平均値から外れたものは、少しだけどできるという形になる場合が多いのです。
この場合、誤差が本当の意味での「ばらつき」であれば、これは、「正規分布」という分布(つまり、平均値付近が多く、それから離れると少なくなっていくような)をします。

この「正規分布に従う」という前提で、平均値±3σの間には、全体の、99%強 が含まれるというのが、統計的に知られています。
これを以て、3σで管理という事になります。


さて、「管理図」ということですが、いろいろな種類のものがあります。
そこで、普通は、UCL, LCL は、製品自体の規格値(か、それから算出された値)を使うので、直接、3σは出てこない気がするのですが。
考えられるのは、x-s (平均と、標準偏差の管理図)で、標準偏差に対する上限管理値が3σなのかなと。(この場合、下限の管理値はありません。0が理想なので)

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため...続きを読む

Q3σについて教えてください(基本的なこと)

文系出身なので、基本的なことが分かっていませんが、仕事の資料で出てきたので教えてください。
3σとは標準偏差で、規格を外れる確率が99.7%? など、少し調べたのですが、まだまだ分かりません。

例)
取引先の製品の、あるパラメータ(寸法)のロット内ばらつきを示す資料に、N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021というものありました。
※数値はうろ覚えです・・・
質問)
AVE.は20個測定した平均が、5.983mmだったということはもちろん分かるのですが、3σの0.021とはどう理解すればよいのでしょうか。
6.00mmに対して、0.021mm以上ずれる確率が0.03%と思えばよいのでしょうか?それともAVE.に対して0.021mmずれる確率???
そもそも0.021の単位は?(mm?)
はてなばかりですみません。初歩的な質問ですみませんが、例を挙げて分かりやすく教えていただけたら幸いです。

Aベストアンサー

> N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021

を普通に読むと、規格6.0mm(±0.3mm) で 20 個製造して検査したところ、平均値は 5.983 で標準偏差は 0.007mm (=0.021÷3) であった、という意味になります。標準偏差の単位は、標準偏差は「平均からのずれ」の平均ですから、平均値と同じになります。

この工程での真の平均値をμとしますと、今回の 20 個製造して得られた平均値 X=5.983 の標準偏差は 0.00157 (=0.007/√20) 程になります。これは、μは 99.7 %の確率で 5.983±(3×0.00157) にあることを示しています。
ここから、真の平均μが 6mm であったならば 0.3% 以下しか起こらないような珍しいことが起こっているという意味で「統計的に有意な差がある」といい、真の平均は6mmではない、と結論づけることが出来ます。

それから、製品一つ一つについては、平均 5.983±0.021 に入らない確率は 0.03 %になります。
何れにせよ、99.7%は規格の範囲内に入っていることになりますね。

> N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021

を普通に読むと、規格6.0mm(±0.3mm) で 20 個製造して検査したところ、平均値は 5.983 で標準偏差は 0.007mm (=0.021÷3) であった、という意味になります。標準偏差の単位は、標準偏差は「平均からのずれ」の平均ですから、平均値と同じになります。

この工程での真の平均値をμとしますと、今回の 20 個製造して得られた平均値 X=5.983 の標準偏差は 0.00157 (=0.007/√20) 程になります。これは、μは 99.7 %の確率で 5.983±(3×0.00157) にあることを示...続きを読む

Q±4σに入る確率について教えてください

ウィキペディアの検索より、
確率変数XがN( μ, σ2)に従う時、平均 μ からのずれがσ以下の範囲にXが含まれる確率は68.26%、2σ以下だと95.44%、さらに3σだと99.74%となる。
と分かりました。

そこで
4σ、


の場合確率はどうなるか教えてください。
よろしくお願い致します。

Aベストアンサー

Excel で NORMDIST を使い、平均 50、標準偏差 10 (いわゆる偏差値)で計算してみましたら、次のようになりました。

 σ 0.682689492137086
2σ 0.954499736103641
3σ 0.997300203936740
4σ 0.999936657516326
5σ 0.999999426696856
6σ 0.999999998026825
7σ 0.999999999997440
8σ 0.999999999999999
9σ 1.000000000000000

Excelの関数の精度がどの程度のものか分かりませんが、9σで100%になりました。

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。


人気Q&Aランキング