【先着1,000名様!】1,000円分をプレゼント!

初歩的な質問で申し訳ないのですが、どうしてもわからないので
質問させていただきました。

ワイブル分布で、故障率をプロットしたいのですが、
このときエクセルのワイブル関数で確率密度関数と累積分布をプロットすると、
以下のような数字になります

x累積分布関数      x確率密度関数
0 0.0%      00.0%
0.30.1%     0.30.7%
0.60.8%     0.65.4%
0.94.0%     0.917.5%
1.212.2%     1.237.9%
1.527.1%     1.561.5%
1.848.1%     1.875.7%
2.170.3%     2.168.7%
2.487.4%     2.443.5%
2.796.4%     2.717.8%
3 99.4%      34.3%
3.399.9%     3.30.5%
3.6100.0%     3.60.0%

確率密度関数の値を累積したものが累積分布になると思っていたのですが、
累積分布の値はそのような数字になりません。

確率密度関数の値を累積したものが累積分布にならないのはなぜでしょうか。
それぞれの使い方が違うのでしょうか。

そうであれば故障率としてはどちらを使えばいいのでしょうか。

本当に初歩的な質問で申し訳ございませんが、ご教授いただきたくお願い申し上げます。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

「ワイブル関数で確率密度関数と累積分布をプロットする」ってありますけど, ワイブル分布のパラメータはどう設定したんでしょうか?



あと, 「確率密度関数の値を累積したものが累積分布になる」とはどういう意味? 確率密度関数と累積分布 (確率分布関数) との関係は #1 にもあるように「密度関数を積分すると分布関数」であり, 密度関数の値を単純に「累積」しても分布にはなりません.
    • good
    • 0

あまり、よくは知らないのですが、以下ののURLの内容から。

とりあえず

http://www.google.co.jp/url?sa=t&rct=j&q=&esrc=s …

でみると データ自身あってないように思われます。

3 99.4%      34.3%
3.399.9% 


累積の方が減ってるのは、まずおかしい。 密度関数を 0からtまで積分したのが累積で 逆に累積を微分したのが密度関数だと思うのですが
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。助かりました

お礼日時:2012/04/06 00:18

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q毎月の故障率をワイブル分析したいのですが

故障率予測にワイブル関数が使われますが
時間t、系数m、尺度ηとすると
(1)故障密度関数
f(t)=(mt^(m-1)/α)EXP(-t^m/α)
[α=η^mになると思います]
(2)ワイブル分布(累積故障率)
F(t)=1-EXP(-(t/η)^m)

と本などに書かれています。

例えば、○万台売った製品の月毎の故障返品率が
1月:0.93%、2月:1.87%、3月:2.0%、4月:2.0%、5月:1.4%・・
として、この折れ線グラフを
y=a*EXP(-bt)
で近似した関数が(1)の故障密度関数に相当するのでしょうか?

(1)の故障密度関数を積分したものが(2)の累積故障率ですね?
逆に-EXP(-(t^m)/α)を微分すれば、(mt^(m-1)/α)EXP(-t^m/α)
となることはわかります。

これについて教えて戴きたく、宜しくお願いいたします。

なお、EXP(-t^m)はe^(-t^m)のことです。

Aベストアンサー

> そのため、ロットごとに製造されてから故障するまでの時間を集計しています。

そういうことでしたら、

> たとえば2006年2月生産の製品について、毎月の故障率を折れ線グラフにすれば、故障密度関数になるのではないでしょうか?

これで、間違ってはいません。

> y=a*EXP(-bt)

a=bでないと系数1のワイブル分布になりませんので、
y=1/η*EXP(-t/η)
で近似する必要があります。
この場合、故障するまでの時間の平均が尺度ηの最尤推定量かつ不偏推定量となります。

Qワイブル分布について

エクセルでワイブル分布を求めました。
求めたワイブル分布を元にランダムに
その分布に入る値を求めたいのですが
どのようにしたらよいのでしょうか
よろしくお願いします。

Aベストアンサー

Excelの=WEIBULL(X,α,β,TRUE)では、ワイブル累積分布関数を
F(X)=1 - EXP(-((X/β)^α)))
で計算するようになっています。

そこで、この逆関数を考えます。
X=β*((-ln(1-F(X))^(1/α))
このF(X)を、0以上1未満の一様乱数 RAND() で置き換えて、
X=β*((-ln(1-RAND())^(1/α))
とすると、得られたXはワイブル分布に従います。

Q累積故障率

カテゴリー違いかも知れませんが、
累積故障率の計算の仕方を教えてください。
毎月 10000台 生産するものがあるとして
生産開始から6ヶ月目に1台、8ヶ月目に2台不良品が発生したとします。
とした場合、
6ヶ月目の累積故障率は
1/60000=16.7ppm
8ヶ月目の累積故障率は
1/80000=25ppm
となる。であっているでしょうか?
ここからワイブルプロットを引いて
将来の故障率を予測しても間違いないでしょうか?
(これだけではデータ不足ですが、やり方として合っているでしょうか?)

ご教授ください_○_

Aベストアンサー

>6ヶ月目の累積故障率は
>1/60000=16.7ppm
>8ヶ月目の累積故障率は
>1/80000=25ppm
毎月の故障率の関さんが累積故障率です。
    月 0 1 2 3 4 5 6 7 8
毎月の故障 0 0 0 0 0 0 1 0 2
累積故障  0 0 0 0 0 0 1 1 3

累積故障率は累積故障を10000で割ればよいと思います。

Q累積ハザード関数

統計学についておしえてください。

ハザード率が良からぬことが起こる確率であることはわかります。

しかし、累積ハザード関数の「累積」のイメージがつかめません。
累積ということは、すべてを足し合わせているという事でしょうか?

足し合わせることに何か意味は有るのでしょうか?

Aベストアンサー

一番関心があるのが、F(t)です。いろんな呼び方がありますが、故障時間分布関数と呼びます。
F(t)=累積故障機器数/総機器数   医療等の分野ではF(t)=累積死亡人数/初期人数
1-F(t)=R(t)を信頼度関数と呼びます。医療等の分野では、生存関数かな?
で、λ(t)=f(t)/R(t) を故障率と呼びます。医療分野ではこれをハザード関数(死亡率)と呼びます。
意味は、時刻tまで故障(死亡)せずに、直後に故障(死亡)する率です。
これを時刻tまで積分したのが、累積ハザード関数H(t)と呼びます。これ自身に意味があると言うより、
F(t)=1-exp(-H(t)) の関係が重要なのです。R(t)との関係で言うと、R(t)=exp(-H(t)) H(t)=-logR(t)
で、何のためにH(t)を考えるかというと、元々の関心はF(t)です。このとき、統計処理でF(t)を推定するとき
H(t)を推定する方がたやすい場合があるからなんです。(そういうデータを取りやすい)

Qワイブル分布の標準偏差

統計初心者です。
ワイブル確率紙のプロットからmの値と平均寿命、標準偏差が求められるようですが、標準偏差はどのように使うのでしょうか?正規分布していないものの標準偏差とは?何でしょうか?
平均寿命±3シグマで99.7%がその範囲に入る??(正規分布ではないので違うと思いますが?)
よろしくご教授願います。

Aベストアンサー

#1に書いたように,標準偏差というのは,もともと正規分布とは無関係な概念です.意味は,平均の周りの2乗モーメントってことです.
正規分布での3σに99.7%ていうのに対応して,任意の確率分布で成り立つチェビシェフの不等式っていうのがあります.
http://www.kwansei.ac.jp/hs/z90010/sugakuc/toukei/cebysev/cebysev.htm

Qワイブル分布を使った推定

ある製品が販売後t年経っても廃棄されずに残っている率(残存率Y(t)と呼ぶことにします)のデータがt=1からt=10まであります。これを元に、t=11からt=50までの残存率を推定したいと思っています。

ワイブル分布を説明した
http://ja.wikipedia.org/wiki/%E3%83%AF%E3%82%A4%E3%83%96%E3%83%AB%E5%88%86%E5%B8%83
を見て、ワイブル・プロットという方法を使うと次のようにできると考えたのですが、妥当なやり方でしょうか。

・t=1~10の時のln(t)を説明変数、ln(ln(1/Y(t)))を被説明変数とした単回帰を行い、回帰式を求める
・回帰式にt=11~50を代入して、ln(ln(1/Y(t)))の推定値を求める(これをZ(t)と書くことにする)
・1/(exp(exp(Z(t)))を計算することにより、Y(t)を求める。

Excelで作ってみたところ、それっぽい曲線はできたのですが。

よろしくお願いいたします。

Aベストアンサー

ANo.2へのコメントについて。

> 線形回帰の関数slope, intercept等

 実はそんなの使ったことなくてですね、大抵いつも行列計算の関数でやってるんですよ。

 要するに
  r[n] = a x[n] + b - y[n]   (n=1,2,…,N。a, bが未知数、r[n]は残差、x[n],y[n]は値が分かっている。)
においてΣ((w[n]r[n])^2) が最小になる解 (a,b)を計算したい。(ただしw[n]は値が分かっている。)ということは
   w[n]r[n] = a w[n]x[n] + w[n]b - w[n]y[n]  (n=1,2,…,N)
においてΣ((w[n]r[n])^2) が最小になる解 (a,b)を計算したって同じなわけで、ここで
  Y[n] = w[n]y[n]
  X[n] = w[n]x[n]
  R[n] = w[n]r[n]
と書くことにすれば
  R[n] = a X[n] + b w[n] - Y[n]  (n=1,2,…,N)
においてΣ(R[n]^2) が最小になる解 (a,b)を計算すればよし。

Excelでやるんですと、

A1:ANにX[n]を入力。B1:BNにw[n]を入力。 つまり、一次式の係数を並べたN行2列の行列(これをJacobianと言いますんで、Jとしましょう)をA1:BNに作る。

C1:CNにY[n]を入力。

E1:G2を選択した状態でE1に {=mmult(transpose(A1:BN), A1:CN)} これでE1:F2に J' Jを、G1:G2にはJ' Y を入れたことになります。(ただし、 ' は行列の転置という意味です。)

I1:J2を選択した状態でI1に {=minverse(E1:F2)} これでI1:J2に(J' J)の逆行列ができます。

L1:L2を選択した状態でL1に{=mmult(I1:J2,G1:G2)} すなわち、(J' J)の逆行列とJ' Yとの積がL1:L2に入ります。

で、答はL1=a, L2=b でやんす。

 なお、{ } ってのは、その内側の式をセルに入力しといて、数式の入力欄内にカーソルを入れた状態のまんまで [command]キーと[enter]キーを一緒に押す(のがMac。Windowsだとどうやるんだか忘れた。)と、勝手に{ } が付きます。

 この手なら、パラメータがもっと沢山ある場合の線形回帰もできますから、知ってて損はないでしょう。

ANo.2へのコメントについて。

> 線形回帰の関数slope, intercept等

 実はそんなの使ったことなくてですね、大抵いつも行列計算の関数でやってるんですよ。

 要するに
  r[n] = a x[n] + b - y[n]   (n=1,2,…,N。a, bが未知数、r[n]は残差、x[n],y[n]は値が分かっている。)
においてΣ((w[n]r[n])^2) が最小になる解 (a,b)を計算したい。(ただしw[n]は値が分かっている。)ということは
   w[n]r[n] = a w[n]x[n] + w[n]b - w[n]y[n]  (n=1,2,…,N)
においてΣ((w[n]r[n])^2) が最小になる解 (a,b)を計...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

QエクセルのIF文で「NOT=」はどう書くのですか?また、>=や<=の場合の書き方を教えてください

タイトルのとおりです

IF文で下記の3つの書き方がわかりません。

NOT=は、<>?
0以外の場合は、A1<>0?

A1が0と同じか、大きい場合は
A1>=0?

なんだか、うまくいきません^^;

よろしくお願いいたします

Aベストアンサー

A1が・・・・・
A1 <> 0  0以外
A1 >= 0  0以上(0を含む)
A1 > 0   0より大きい(0は含まない)
A1 <= 0  0以下(0を含む)
A1 < 0  0未満
A1 = 0  0

=<,=> などの書き方は使えません。

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Q3σ法による計算式

当方、管理や統計学など全く無知ですのでわかりやすく教えて下さい。

仕事で、管理図を作成するにあたり、3σ法で管理限界線(UCL,LCL)を計算せよとの事を言われましたが、理解出来てません。

3σ法の公式とかあるんでしょうか?あったら教えて下さい。あと、3σとは何か、簡単に教えて下さい

Aベストアンサー

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため)
4)それを、(データの数-1)で割る(気持ちとしては、ばらつきの量を平均した感じ・データの数-1で割るのは、「母標準偏差の推定」という考え方があるから)
5) 3)でばらつきを2乗しているので、それをルートで開いて元に戻す

とうことになります。

統計上いくつかの前提があって、例えば、製造工程で普通にものを作った場合、いろいろなばらつきは、それぞれ独立に出ます。
そこで、結果的には、ある一定の平均値付近のものが多くでき、平均値から外れたものは、少しだけどできるという形になる場合が多いのです。
この場合、誤差が本当の意味での「ばらつき」であれば、これは、「正規分布」という分布(つまり、平均値付近が多く、それから離れると少なくなっていくような)をします。

この「正規分布に従う」という前提で、平均値±3σの間には、全体の、99%強 が含まれるというのが、統計的に知られています。
これを以て、3σで管理という事になります。


さて、「管理図」ということですが、いろいろな種類のものがあります。
そこで、普通は、UCL, LCL は、製品自体の規格値(か、それから算出された値)を使うので、直接、3σは出てこない気がするのですが。
考えられるのは、x-s (平均と、標準偏差の管理図)で、標準偏差に対する上限管理値が3σなのかなと。(この場合、下限の管理値はありません。0が理想なので)

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため...続きを読む


人気Q&Aランキング