プロが教えるわが家の防犯対策術!

このカテゴリーでいいのかわかりませんが職場である分析をしてその結果に対して
どう考えていいか統計的手法を用いて証明したいのですがよくわかりません。
初心者でもわかるように詳しい説明をしていただけないでしょうか。宜しくお願いします

分析結果より、上限規格の30個以上には まずならないというのを統計的手法を用いて証明して
欲しいと上司から言われています。結果だけを見ても超える事はないと一目でわかりますが。


分析結果から得られた情報として n=69 σ=3.7  平均=4.0  max=14  min=0

上記の結果が得られて上限の規格を30以下とした場合、自分なりに考えてみました。(下限は考えなくてもいいです。より0に近いほうがいいので無視して下さい)

(1)3σの幅で 3×3.7=11.1  平均が4.0なので4.0+11.1=15.1になります。
 よって。3σは99.7%が3σにおさまるので(1000個だと997個がok、残り3つが不良)と考えられる
ので上限規格の30以下を考えると30を超えるのは極めて少ないという結論でよろしいでしょうか?
6σでみても6×3.7=22.2  4+22.2=26.2になるので26.2個が100%に限りなく近くおさまっている
と考えていいのでしょうか?

(2)工程能力指数で片側 (30-4.0)/3√3.7=Cp= 4.48となり工程能力指数も十分満足しており
 30個は超える事がないと考えていいのでしょうか?そもそもここで工程能力指数をだしても
無意味でしょうか?

(3)その他何か推定とか検定して30個は超えないということが証明できるか又は
 上記の統計結果から上限はいくらぐらいになるか(1)の他に推定とかは出来るでしょうか?

自分の考えとしては(1)と(2)で30個を超えることはないとこれで証明できると思うのですが
そのあたりがよくわかりません。

どなたか詳しい方、指導の程、宜しくお願いします。
  

A 回答 (6件)

どのようなものの統計かはわかりませんが、データが変ではないでしょうか。



n=69 σ=3.7  平均=4.0  max=14  min=0

では、正規分布からは遠い様な気がするので、これを正規分布モデルで考えるのは適当ではないのではないでしょうか。
「0に近いほうがいい」というなら、平均が「0」に近く、データも負の値があるのが妥当だと思うのですが、どうでしょう。
二項分布なのでしょうか。データの取得とモデルを検討したほうがいいのではないでしょうか。

また、「上限規格の30個以上」という意味も分かりません。nが大きくなれば、規格を超えるものも多くなるはずですよね。

もう少し、どんなものについて、どうやって得たデータなのかわからなければ、「統計的手法を用いて証明」などできないと思いますが。私の勘違いならご容赦を。

この回答への補足

okormazdさん、さっそくのアドバイスありがとうございます。説明も悪く統計にも詳しくなくて
すいません。10グラム粒を計ってその中で色の付いた粒を数えてデータを取ったものです。

データは粒を数える方法でその中の色が付いているものを数えます。その色の付いた粒の数(個数)が
規格は30以上ではなくて 30以下です。なので色のついてない粒もあるので0のものも多数あります。
それで平均が4粒ということです。ですから負の値はないのです。(最小が0個になります)

この色の付いたものが悪い粒とお考え下さい。色のついてないものが良い粒です。
色の付いてない粒が0が理想なんですが。これで色の付いている粒の規格が10gの中に30個以下
というのが規格です。

これでどうでしょうか?宜しくお願いします。

補足日時:2012/01/14 12:39
    • good
    • 0

残念ながらお考えの方法ではできないと思います。



<分析結果より、上限規格の30個以上には まずならないというのを
統計的手法を用いて証明>という言葉を
<分析結果より、1,000個中で上限規格(3σ)を越える物の個数は30を遙かに下回る事を
統計的手法を用いて証明>と理解してよろしいでしょうか?

3σの論法で基本的に間違っているのは、<σ=3.7  平均=4.0  max=14  min=0>
の分布は正規分布とは程遠い事です。
したがって正規分布を使ったお考えの論は何の意味も持ちません。

分布形はポアソン分布に似たものになると思います。
http://ja.wikipedia.org/wiki/%E3%83%9D%E3%82%A2% …

ポアソン分布の場合、平均=分散ですから、この図のλ=4に近いように思えます。
(λが十分大きい場合、正規分布となります。)

これを手許のデータでご確認の上で、上限公差を3σとした場合の、ポアソン分布での出現確率を
考えられる様お勧めします。

この回答への補足

drmurabergさんアドバイスありがとうございます。統計に無知で情けないです。

No.1のokormazd さんも言っておられる正規分布にはならないので3σでの自分の考えでは

無理のようですね。安易に考えていました。

上限規格が30以下でデータからも全て30以下になっているのでこれでいいのかと思いましたが
難しいですね。

ポアソン分布ですか。これで一度調べてみます。簡単に出来るものなのでしょうか。


分析結果より、1,000個中で上限規格(3σ)を越える物の個数は30を遙かに下回る事を
統計的手法を用いて証明>と理解してよろしいでしょうか?

ここは自分の考えではデータの結果より 30以上にはならないというのを証明したかったです。

データの取り方はNO.1さんの補足で書きました通りです。

頭の中がごちゃごちゃになってきました。すいません。

補足日時:2012/01/14 13:13
    • good
    • 0

No.1への補足で納得がゆきました。



69回サンプルを10gずつ取り、着色した粒の数を数えた訳ですね。
着色した粒の出現が希な場合はポアソン分布で表されるのは
納得できます。

まずサンプルに含まれる粒数が30個のベースになります。
1粒の平均重さをw(g)とすると、サンプル中の粒の平均個数Nは
N=10(g)/w(g) 個
となります。

データの分布がポアソン分布
P(X=k)= λ^k*exp(-λ)/k!
に従うとすると
k=4.0,λ(=σ)=3.7での値はP=0.19279
k=4.0,λ(=3σ)=11.1での値はP=0.00956
となります。

3σより大きな物の占める割合Pxは
Px=∫P(X=k)dk= =∫λ^k*exp(-λ)/k!dk   積分範囲は3σ~∞
となります。(P(X=k)は0~∞で1に規格化してある。)

着色粒の期待個数Nexは
Nex = N*Px
でこれが30個よりどれだけ小さいかが判断の根拠になります。

分布がポアソン分布とは違う場合は、データから近似曲線を得て、
それを数値(または図上で)積分することも考えられます。

この回答への補足

drmuraberg さんありがとうございます。なかなか理解できず今ポアソン分布を調べて

いるのですが、ホアソン分布にあてはめて計算すると 30粒になる確率は

0.00000000000000008%の確率で限りなく0に近いことになるのでしょうか?(エクセルの関数で計算)


あまりにも高度すぎて理解できてないです。すいません。

補足日時:2012/01/14 16:28
    • good
    • 0

チェビシェフの不等式によると


http://ja.wikipedia.org/wiki/%E3%83%81%E3%82%A7% …
任意の分布に対して、3σの範囲内に全体の8/9が含まれることになります。

>3σは99.7%が・・・
の部分を「3σは88.8%が」、と置き換えれば、どんな場合でも問題なく通用します。
    • good
    • 0
この回答へのお礼

foomufoomuさんありがとうございます。チェビシェフの不等式 はじめて耳にしました。

まだまだわからない事が沢山あります。勉強になります。3σが88.8%ですか。

ありがとうございました。

お礼日時:2012/01/14 15:28

訂正


<Px=∫P(X=k)dk= =∫λ^k*exp(-λ)/k!dk>

kの積分ではなく、kとλを固定して得られた曲線のグラフの
Xが3σ以上の部分の面積です。

離散的な数字ですので、横軸の離散数に付いての和を取っても良いでしょう。
横軸の0以上の数字は(数表から)
X= 0, P=0
X= 1, P=0.01533
X= 2, P=0.09022
X= 3, P=0.16803
・・・・・・・
X=11, P=0.01019
X=12, P=0.00531
X=13, P=0.00269
X=14, P=0.00133
X=15, P=0.00065

Pの和 X1~X15=0.99956
Pの和X11~X15=0.02017
Px=0.02017/0.99956=0.0202

つまり、この場合3σ以上の粒の個数は
Nex=N*0.0202となります。
10/wが1000なら20個です。

検算はお任せします。

余談ですが、
宇宙からの放射線がカウンターに入る時間間隔がポアソン分布に従います。
間隔ほぼゼロで来るのも希、長い時間来ないのも希だからです。
ガイガーカウンタで測って解析させられました。
それ以外では、航空機事故の起こる間隔がこの分布に従うとされています。
  

この回答への補足

何度も申し訳ないです、理解できずに。1g=200粒 で10gで2000粒です。(実測値の平均)

重さが1粒0.005g(5mg)

10/wが2000粒の場合は3σ以上の面積の部分が40粒になるということでしょうか?

理解が出来なくてすいません。3σ以上の部分の色が付いた粒が40粒?

なんかますますわからなくなってきました。こんなに詳しく説明してもらっているのに理解力

がなくて申し訳ありません。

補足日時:2012/01/14 17:18
    • good
    • 0

補足を見て気付きました。



データは2000個(10g)が一まとめのものを1サンプルとし,
69サンプルを作り、それに付いて着色粒子の数を数えた。

その結果が、ポアソン分布に近くなる可能性は高いですが、
<σ=3.7  平均=4.0  max=14  min=0>
からλ=4で議論を進めたのは早とちりでした。

69個のサンプルの内、着色粒の無いサンプルの個数が1番多い
のでは?
そして着色粒の数が多い裾がだらだらと14個まで伸びているのでは?
この場合λが1,2に近くなりますが、平均も分散も共に理論値のλ=k=1,2
より大きくなります。
外れが大きくなると、ポアソン分布を想定した議論は無意味になります。
正規分布を想定した議論がベースを失うように。

分布を想定しない議論の提案も有りますが、一般には確率は悪い方向に
動くので、シビアな品質問題への適用は難しいでしょう。
それにデータベースとの関連で説明もさらに難しくなります。
データーベースが有りながらユーザー(上司)への説明で「データーは
さておいて、数学の理論では云々」では「なぬ?!」と言う反応が来ることが
予想されます。

2000個中40個と解釈すべきか、2000回で40回と考えるべきかは混乱中です。

まずデータを精査され、どの分布に従うか、またはどんな関数で近似できるのか
を検討されることをお勧めします。
データとヒストグラムを写真添付して再質問されたらいかがでしょうか。
学問教育の欄にはよく出かけます。
    • good
    • 0
この回答へのお礼

drmurabergさん貴重なお時間をさいて頂きありがとうございます。

そもそも自分が質問するときにもと詳しく書いてデータも合わせて添付するのが

本当ですね。たび重ねてお詫びします。一度データを整理してみたいと思います。

しかしdrmurabergさん統計にすごく詳しいですね。うらやましいです。

この機会に少しでもと思いいろいろ勉強します。ありがとうございました。

お礼日時:2012/01/14 19:08

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!