n=2やn=3の範囲(R)から標準偏差を推定する方法があると聞きました。統計の本を見たりしたのですが、方法がわかりません。
計算方法がわかる方がいらっしゃいましたら教えて下さい。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

管理図法の管理限界を決めるための指標として、シグマの推定値を求めるために使われる手法があります。


範囲 R にサンプル数によって決まる係数を掛けてやります。式で書けば
 標準偏差の推定値=係数×R
となります。
この係数はサンプル数が増えれば小さくなります。
n=2 のとき 係数=0.886
n=3 のとき 係数=0.591
という具合です。正規分布を仮定して理論的に導出されたものです。理論の詳細はJISを参照してください。
    • good
    • 0
この回答へのお礼

この方法でσを推定するのはn=2かn=3のときくらいだと思うので、実際に係数も教えて頂き助かりました。ありがとうございました。

お礼日時:2005/04/23 07:13

管理図。

上下管理限界曲線が平均値から3シグマ離れています。よって差を3で割ればシグマが求まって....
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q3σ法による計算式

当方、管理や統計学など全く無知ですのでわかりやすく教えて下さい。

仕事で、管理図を作成するにあたり、3σ法で管理限界線(UCL,LCL)を計算せよとの事を言われましたが、理解出来てません。

3σ法の公式とかあるんでしょうか?あったら教えて下さい。あと、3σとは何か、簡単に教えて下さい

Aベストアンサー

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため)
4)それを、(データの数-1)で割る(気持ちとしては、ばらつきの量を平均した感じ・データの数-1で割るのは、「母標準偏差の推定」という考え方があるから)
5) 3)でばらつきを2乗しているので、それをルートで開いて元に戻す

とうことになります。

統計上いくつかの前提があって、例えば、製造工程で普通にものを作った場合、いろいろなばらつきは、それぞれ独立に出ます。
そこで、結果的には、ある一定の平均値付近のものが多くでき、平均値から外れたものは、少しだけどできるという形になる場合が多いのです。
この場合、誤差が本当の意味での「ばらつき」であれば、これは、「正規分布」という分布(つまり、平均値付近が多く、それから離れると少なくなっていくような)をします。

この「正規分布に従う」という前提で、平均値±3σの間には、全体の、99%強 が含まれるというのが、統計的に知られています。
これを以て、3σで管理という事になります。


さて、「管理図」ということですが、いろいろな種類のものがあります。
そこで、普通は、UCL, LCL は、製品自体の規格値(か、それから算出された値)を使うので、直接、3σは出てこない気がするのですが。
考えられるのは、x-s (平均と、標準偏差の管理図)で、標準偏差に対する上限管理値が3σなのかなと。(この場合、下限の管理値はありません。0が理想なので)

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため...続きを読む

Qエクセル 0や空白のセルをグラフに反映させない方法

以下の点でどなたかお教えください。

H18.1~H20.12までの毎月の売上高を表に記載し、その表を元にグラフを作成しています。グラフに反映させる表の範囲はH18.1~H20.12の全てです。
そのためまだ経過していない期間のセルが空白になり、そこがグラフに反映され見づらくなります。
データを入力する都度グラフの範囲を変更すればいいのですが、うまく算式や設定等で空白や0円となっているセルをグラフに反映させない方法はありますか?

お手数ですが、よろしくお願いいたします。

Aベストアンサー

売上高のセルは数式で求められているのですよね?
それなら
=IF(現在の数式=0,NA(),現在の数式)
としてみてください。
つまり、0の場合はN/Aエラーにしてしまうんです。N/Aエラーはグラフに反映されません。

QS管理図の管理限界線の求め方について

Xbar管理図とS管理図の、管理限界線(UCL LCL)の求め方が分かりません。

Xbar管理図の管理限界線の求め方は下記であっていますか?

・集めたデータの平均値と、標準偏差(3σ値)を求める
・平均±3σ値をUCL LCLとする。

S管理図の管理限界線の求め方は下記であっていますか?

・集めたデータの標準偏差の平均値と、その標準偏差(3σ)を求める
・標準偏差の平均±3σをUCL LCLとする。

Aベストアンサー

No.2 です。

>s管理図は情報が少なく、あったとしても従来の係数を使った求め方なので、従来の求め方イコール3σで求めることと同じなのかなと思っているのです。

それでよいと思います。元々のQC管理図の考え方も、「標準偏差の3倍を越えたら明らかに異常」という考え方に基づいていると思いますので。

標準偏差や、その「3倍」の意味は、よろしいですね? 「正規分布」の特性ということです。
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm

Q統計学的に信頼できるサンプル数って?

統計の「と」の字も理解していない者ですが、
よく「統計学的に信頼できるサンプル数」っていいますよね。

あれって「この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる」という決まりがあるものなのでしょうか?
また、その標本数はどのように算定され、どのような評価基準をもって客観的に信頼できると判断できるのでしょうか?
たとえば、99人の専門家が信頼できると言い、1人がまだこの数では信頼できないと言った場合は信頼できるサンプル数と言えるのでしょうか?

わかりやすく教えていただけると幸いです。

Aベストアンサー

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。
 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル(比べるための基準となるサンプル)を比較するときに、そのサンプルの分布が正規分布(正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式)でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。それ以下では、いくらデータに差があるように見えても検定で差を検出できません。
 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合(分散値)、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された(差を出すために)必要なサンプル数だけサンプルデータを集めれば、差があると判定されます(すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる)。よって、集めるサンプルの種類により、計算上出された(差を出すために)必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。

 具体的に例示してみましょう。
 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。一見すると後者のほうが値が大きく、前者と差があるように見えます。そこで、差を検定するために、t検定を行います。結果として計算上差があり、前者と後者は計算上差がないのにあると間違えて判断する可能性の許容値(有意確率)何%の確率で差があるといえます。常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。
 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0.8とした場合に5.7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。有意確率5%で差があるとはいえない結果になります。この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551.33となり、552個もサンプルを抽出しないと差が出ないことになります。この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。

 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲(小数点何桁レベルの誤差)に納まるようなサンプル数を算出していると考えます。テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。

> どのような評価基準をもって客観的に信頼できると判断・・・
 例えば、工場で作られるネジの直径などは、まったくばらつきなくぴったり想定した直径のネジを作ることはきわめて困難です。多少の大きさのばらつきが生じてしまいます。1mm違っても規格外品となります。工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。しかし、製品をすべて調べるわけにはいきません。そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。
 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。
 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。

 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。
 ただ、経験則上指標的なものはあります。正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない(それ以下でも問題ない場合もある)とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。でも、あくまでも指標です。

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な...続きを読む

QX-R管理図の管理限界の設定について

X-R管理図の管理限界の設定方法がわかりません。
今、手元にある資料は詳しい計算式などが書いてないのですが、
日々のデータの平均をX(/)とし、さらに、その月ごとの平均をX(//)=1.90
日々のデータの差をR(/)とし、さらに、その月ごとの差の平均をR(//)=0.09

とした時に
X図として
A2R(/)=1.88×0.09
UCL=X(//)+1.88×0.09=2.07
LCL=X(//)-1.88×0.09=1.73

R図として
D2R(/)=3.27×0.09
UCL=0.29

となってます。ここで質問なのですが
(1)A2R(/)のA2とは何の数字を表してるのでしょうか?
(2)D2R(/)のD2とは何の数字を表してるのでしょうか?
(3)R図はLCLは必要ないのでしょうか?

素人の質問で申し訳ないのですが、よろしくお願いします。

Aベストアンサー

(1)A2とは、管理限界線UCL、LCLを引くための係数です。ふつうは1回に採るサンプル数から計算されます(この計算は面倒なので、実施する人には、数表の形で計算結果だけが与えられています)。工程が安定していると仮定すれば、サンプル数が多いほど、サンプル平均は母平均に近いはずですから管理限界幅は狭くてよいことになります。

(2)D2もまったく同様で、これも1回のサンプル数の関数として与えられます。ただし、Rの場合は、Xバーと違って、サンプル数が大きいほどRの期待値は大きいので、管理限界が広くなるように設定されます。

(3) R管理図には「下方限界」はありません。もし、異常に小さいRが出たとしても、それは偶然の産物と見なします。万一、(めったにないことですが)装置の調子が突然良くなって、バラツキが小さくなったとしても、それは「悪いこと」ではないので、アクションを取る必要はないのです。

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q統計的工程管理

仕事で工程管理の勉強を始めました。
基礎的な用語なんですけど分かりません、教えてください。
(1)工程能力指数のCpとCpkとの違いが分かりません。どちらも同じ意味なのでしょうか?
(2)PpとPpkは何を意味するのでしょうか?

教えて下さい、宜しくお願します。

Aベストアンサー

(1) Cpは工程能力指数(Process Capability Index)のことで、工程でのデータ分布と規格との数的関係を表したものです。通常、
Cp=(上限規格値-下限規格値)/6s
    s=工程データの標準偏差
で計算されます。
ただし、このCpはデータの分布の中心(=平均値)が上限規格値と下限規格値の中央にあることが前提となっていて、ズレは考慮されていません。
そこで、平均値が上下規格の中心からずれている(=かたより)場合に用いる指標として、Cpkが作られました。

Cpk=(1-K)Cp

  |平均値-(規格上限値+規格下限値)/2|
K=--------------------------------------
   (規格上限値+規格下限値)/2

  |・・|は絶対値

です。したがって、偏りがない場合(平均値が上下規格値の中央と一致)はK=0で、Cp=Cpkですが、ズレが大きいほど、工程能力指数は下がります。

(2) Ppは工程性能指数(Process Performance Index)といわれ、アメリカのGMなどが提唱するQS9000という規格で使われているものです。
QS9000では、上記のCpの式で計算したものをPpと呼びます。ではCpはどうなるのかというと、上記式のsの部分が Rbar/d2 となります。これはX-R管理図から求めるもので、統計上、郡内変動を表します。これに対して、Ppはデータの標準偏差を使うところに違いがあります。
PpkはCpkと同様で、
Ppk=(1-K)Pp
Kの計算は上記と同じです。

QS9000では工程管理の一貫として管理図を使うことが書かれているため、管理図から工程能力指数を出そうとしたようです。そのため、工程管理でわかる工程能力とサンプリングデータによる工程能力を分ける意味で、PpとCpを作ったようです。

ちなみに、どの指数も、1以下では工程能力がないと判断され、QS9000では2以上が目標とされます。

(1) Cpは工程能力指数(Process Capability Index)のことで、工程でのデータ分布と規格との数的関係を表したものです。通常、
Cp=(上限規格値-下限規格値)/6s
    s=工程データの標準偏差
で計算されます。
ただし、このCpはデータの分布の中心(=平均値)が上限規格値と下限規格値の中央にあることが前提となっていて、ズレは考慮されていません。
そこで、平均値が上下規格の中心からずれている(=かたより)場合に用いる指標として、Cpkが作られました。

Cpk=(1-K)Cp

  |平...続きを読む

Q標準偏差を求める際のデータ数について

統計初心者ですが、この度アンケート調査を行い、その結果報告書を作成しなければならないのですが、データ数9の場合、平均、最小、最大に加え、標準偏差も記載しようと思っていますが問題はないでしょうか?

標準偏差は、データが30、50以上ないと意味がないということを聞いたことがあるので戸惑っています。

また問題ない場合、「データ数が少ない場合は補正係数を掛ける」という説明を見かけたのですが、これは単に算出した標準偏差に補正係数を掛けて、記載すればいいのでしょうか? この場合の記載の仕方などについても教えていただけないでしょうか。

Aベストアンサー

標準偏差を求めることは,特に問題はありません。
ただ,データ数が少ないとばらつき具合が正しいかどうかの判断に困るというだけです。

補正係数については,条件によって変化する場合,例えばアンケートだと男女差や年代等による差異を軽減するためには使えますが,質問を見る限りは補正をする必要はないと思います。

標準偏差の意味を知る意味でも,正規分布について調べてみることをおすすめします。

Q統計で、有意水準を、0.01あるいは、0.05に決める意味は?

統計で、有意水準を、0.01あるいは、0.05に決める意味が
わかりません。分析する人によって決められると思うのですが、何を基準に
きめればよいのでしょうか?

あと、t検定とは、どんな検定の仕方なのでしょうか?よろしくお願いします。

Aベストアンサー

◇0.05と0.01の使い分けについて

 一般的には 0.05 (危険率5%)を使います。

 理由は、工業製品の場合、多数の集合体から少数をサンプリングして
 カタマリが合格するか?または違いがあるか短時間に判断を
 下す(スクリーニングする)ことが要求されます。 
  また、正確な結果を求めるには、それ相応のデータ数を採る必要
 ありますが、それには時間と労力が掛かります。
 従いまして、費用対効果を念頭におき、危険率を決めます。
 
 大抵の場合、危険率5%の有意差検定にて済みます。
 但し、要求が厳しい場合とか、測定結果の差が大きい場合には
 1%でも検定して結果を記載します。

◇t分布表にて判断する適用範囲;下記条件の場合 t分布を使います。

<< 適用条件 >>
 ロットが異なる2つのサンプル群の標準偏差が未知な場合。
<< 適用範囲 >> 
 1.サンプリングして得られた平均値の差に違いがあるか?判断する場合。
 2.平均値の範囲を推定する(区間推定)場合。

例)ある製品を条件を変えて製造した場合、2つの集合体(カタマリ)
   ができる。そこから各30ケづつサンプリングして平均値を求める。
   この平均値に違いがあるか判断する場合に t分布を使います。

 一般的な工業製品は、全数検査しないうえ、これから作るモノの品質を
 予測しながら保証しければなりません。この場合にはt分布を使うわけです。
 
 一方、サンプル全数を測定して標準偏差が分かっている場合は、
 正規分布表にて有意差検定します。
 つまり、母集団の標準偏差が既知(キチ)の場合、正規分布表を使います。

◇その他
 ご参考まで、既にご存知であろうと思いますが・・・
・0.05 とは危険率 5%という意味で, 確率 5%の割合で間違った
 判断を下す事があるという事です。 
・検定結”判果にて ”有意差が無い”ということは ”同じである"という事
 ではありません。 このデータだけからでは断が下せない”と
 いうだけです。
                       以 上
                  

◇0.05と0.01の使い分けについて

 一般的には 0.05 (危険率5%)を使います。

 理由は、工業製品の場合、多数の集合体から少数をサンプリングして
 カタマリが合格するか?または違いがあるか短時間に判断を
 下す(スクリーニングする)ことが要求されます。 
  また、正確な結果を求めるには、それ相応のデータ数を採る必要
 ありますが、それには時間と労力が掛かります。
 従いまして、費用対効果を念頭におき、危険率を決めます。
 
 大抵の場合、危険率5%の有意差検定にて済みま...続きを読む


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング

おすすめ情報