「夫を成功」へ導く妻の秘訣 座談会

仕事で、「平均から3σを引いたところに下限値を置く」という内容で困っています。
ある製品66個の実績があり、平均:352、ばらつき:78で、3σ:118.62(小さい方へ3σ)です。
これで、「平均から3σ引いたところ」というと、
 (1)352-118.62=233.38
になるのでしょうか?
 (2)352-118.62=233.38 よって、352-233.38=118.62
になるのでしょうか。

このQ&Aに関連する最新のQ&A

A 回答 (4件)

ばらつきが正規分布に従う場合、平均値を中心に上下3σ以内、つまり平均-3σ~平均+3σの間に全体の97%(数値はうろ覚え)が入ります。

つまり(平均-3σ)より下になることはほとんどないので、工業製品ではここを下限値とする事が多いです。

平均値から3σを引いたところ、つまり(1)の233.38が下限値となります。この製品は352-118.62~352+118.62の間にほとんど全ての品物が入る筈です。逆に言うとこの値から外れた品物が多い場合、何らかの異常を持つ可能性が高いということです。
    • good
    • 1
この回答へのお礼

MtGenkotsuさん

ありがとうございました。
とても参考になりました。

正規分布を作ったり思い浮かべたりして考えたら
わかりやすいですね。

ZnWater

お礼日時:2008/04/04 10:06

>平均:352、ばらつき:78で、3σ:118.62(


管理図名は??。Xバー、R管理図か、A管理図(分析用管理図なので゜しよう経験が片手ほどなく、名称が間違っている場合があります)か

測定値 Xi, i={1,2,...,66}
平均値 X^(チルダですがキーボード表記はバーです。メジアン管理図用メジアンの意味ではないです)= ΣXi / 66 =352
標準偏差 σ=78
として求めたのか、

たとえば2個組で、
測定値 Xij i={1,2,...33], j={1,2}
範囲 Ri = |Xi1-Xi2| 「 |」は絶対値を示す符号
平均値 AVEi = (Xi1+Xi2)/2
ばらつき = Σ Ri / 33
平均 = Σ AVE1 / 33
(計算式は記憶なので間違っている場合があり)として求めたのか。

σをつかった管理図(A管理図等)の場合には
ばらつき=1σ
ですので、352-78*3 が下限信頼限界
他の管理図の場合には、多くは
3σ = 範囲の算術平均値(ばらつき) * 管理図によって変化する定数
のはずです(計算式の記憶は曖昧)から、
352-118.62 = 352-119 = (計算間違いをするときがありますのでしません)
となります。

さらにややこしいのが、JISの場合です。
上記の場合、平均値が整数の範囲で丸められていましたので、3σも整数の範囲に丸めて(118.62 → 119)から減じます。
JISの場合にはJISの丸め方(例、0.55555→0.555だったかな、記憶が曖昧)を使う場合とつかわない場合(ふつうの学校教育で行う四捨五入)、途中計算に丸めをする場合(計算桁を合わせて計算する場合)としない場合(最後の1回に限って丸めをする場合)があります。どの方法を使うかは、個別のJISを読んで見ないとわかりません。
詳しくは、JIS Z (番号忘却)の なんとか管理図を見てください。参考文献のところに、JIS Z (番号忘却)、数値の丸め方(名称の記憶が曖昧) と記載されていれば、JISの丸め方を使用します。

ご質問文では、「352-118.62」と使っているので、どの規格を使っているのか読み取れません。学校教育の四捨五入ではないということは見当がつきます。

分析用管理図の場合には、最後の1点を除いて計算して、最後の1点が管理限界内にあるのか、を議論するために使用します。管理用管理図の場合には、通常100点以上(66点と少ないので管理図用管理図の場合があり、文面からどちらか、読み取れなかった理由です)の点を取り、上限信頼限界と(場合によっては作成不能の場合もありますが)下限信頼限界を求め、使用します。
U表(以下の数値は記憶で書いているので間違っているときがあり、U表を見て正確な数値を読み取ってください)では、3 となる確率がたしか、1/1000くらいで、1回に1回くらい間違うときがありますが、ほぼなにかしらカの異常な状態です。
しかし、発生確率1/1000が低いので、発生している異常な状態を見落とすことがあります。そこで、連を読むのです(連の考え方は略。必要ならば補足ください)。
2σを超える確率が5%くらい、1σを超える確率が60%くらいあります。つまり、1σと2σの間に点が偏っている場合も異常です(2つの異なるサンプル源を混ぜて測定している場合によく発生する)。ですから、最初に管理図を作るときにはX管理図も作成して、σ目盛りを書いて度数分布をとると、管理図自体が意味を持たない場合があります(他人には見せないこと。3σ線以外を管理図に書く人間は、統計をよほど知っている人間か、どうしょうもない馬鹿がすること。ご質問者のレベルでは後者と言われる場合が想定される)。
    • good
    • 0

普通ばらつきσ=78ですよね?


3σ=3×78=234じゃないんですか?
    • good
    • 0

平均-3σ=352-3×78=352-234=118


正規分布のグラフをイメージして、平均より左側に3σのところが規格です。

参考URL:http://www.saga-ed.jp/workshop/edq01442/seiki/no …
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q3σについて教えてください(基本的なこと)

文系出身なので、基本的なことが分かっていませんが、仕事の資料で出てきたので教えてください。
3σとは標準偏差で、規格を外れる確率が99.7%? など、少し調べたのですが、まだまだ分かりません。

例)
取引先の製品の、あるパラメータ(寸法)のロット内ばらつきを示す資料に、N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021というものありました。
※数値はうろ覚えです・・・
質問)
AVE.は20個測定した平均が、5.983mmだったということはもちろん分かるのですが、3σの0.021とはどう理解すればよいのでしょうか。
6.00mmに対して、0.021mm以上ずれる確率が0.03%と思えばよいのでしょうか?それともAVE.に対して0.021mmずれる確率???
そもそも0.021の単位は?(mm?)
はてなばかりですみません。初歩的な質問ですみませんが、例を挙げて分かりやすく教えていただけたら幸いです。

Aベストアンサー

> N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021

を普通に読むと、規格6.0mm(±0.3mm) で 20 個製造して検査したところ、平均値は 5.983 で標準偏差は 0.007mm (=0.021÷3) であった、という意味になります。標準偏差の単位は、標準偏差は「平均からのずれ」の平均ですから、平均値と同じになります。

この工程での真の平均値をμとしますと、今回の 20 個製造して得られた平均値 X=5.983 の標準偏差は 0.00157 (=0.007/√20) 程になります。これは、μは 99.7 %の確率で 5.983±(3×0.00157) にあることを示しています。
ここから、真の平均μが 6mm であったならば 0.3% 以下しか起こらないような珍しいことが起こっているという意味で「統計的に有意な差がある」といい、真の平均は6mmではない、と結論づけることが出来ます。

それから、製品一つ一つについては、平均 5.983±0.021 に入らない確率は 0.03 %になります。
何れにせよ、99.7%は規格の範囲内に入っていることになりますね。

> N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021

を普通に読むと、規格6.0mm(±0.3mm) で 20 個製造して検査したところ、平均値は 5.983 で標準偏差は 0.007mm (=0.021÷3) であった、という意味になります。標準偏差の単位は、標準偏差は「平均からのずれ」の平均ですから、平均値と同じになります。

この工程での真の平均値をμとしますと、今回の 20 個製造して得られた平均値 X=5.983 の標準偏差は 0.00157 (=0.007/√20) 程になります。これは、μは 99.7 %の確率で 5.983±(3×0.00157) にあることを示...続きを読む

Q3シグマの実際の計算方法について

3シグマはエクセルの関数で「=STDEV(範囲)*3」だと思います。
これで計算をしているのですが、答えが合っているのかどうかが分かりません。
実際の計算式を加減乗除にてあらわせるのでしょうか。
例えば「615」「626」「631」「624」「601」の5つの数字の
3シグマはエクセルの上記の関数に当てはめると「35.41」と云う数値が得られます。
これを検証したいのですが...

Aベストアンサー

標準偏差は簡単に言うと
√(各データを2乗の平均-各データの平均の2乗)
となります。
√があるので加減乗除だけで計算するのは難しい。√以外の計算は加減乗除だけで簡単に出来ます。

A1~A5の各データがあるとします。
B1~B5にA1~A5を2乗したものを入れます。B1に"=A1^2"と入力、それをB2~B5にコピーします。
A6にA1~A5の平均を入れます。A6に"=AVERAGE(A1:A5)"と入れる。A6をB6にコピーするとB1~B6の平均が求まります。
C6に"=(B6-A6^2)^0.5"と入れるとそれが標準偏差σです。この値を3倍すれば3σになります。

手計算でやる場合は、次の方法のほうが桁数が少なく計算しやすいかもしれない。
まず、平均値を求める。
各データと平均値との差を求める。
その差の2乗を計算し、その平均値を出す。
得られた値の平方根をとる。(これで標準偏差σが得られる。)
得られたσを3倍する。

Q3σ法による計算式

当方、管理や統計学など全く無知ですのでわかりやすく教えて下さい。

仕事で、管理図を作成するにあたり、3σ法で管理限界線(UCL,LCL)を計算せよとの事を言われましたが、理解出来てません。

3σ法の公式とかあるんでしょうか?あったら教えて下さい。あと、3σとは何か、簡単に教えて下さい

Aベストアンサー

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため)
4)それを、(データの数-1)で割る(気持ちとしては、ばらつきの量を平均した感じ・データの数-1で割るのは、「母標準偏差の推定」という考え方があるから)
5) 3)でばらつきを2乗しているので、それをルートで開いて元に戻す

とうことになります。

統計上いくつかの前提があって、例えば、製造工程で普通にものを作った場合、いろいろなばらつきは、それぞれ独立に出ます。
そこで、結果的には、ある一定の平均値付近のものが多くでき、平均値から外れたものは、少しだけどできるという形になる場合が多いのです。
この場合、誤差が本当の意味での「ばらつき」であれば、これは、「正規分布」という分布(つまり、平均値付近が多く、それから離れると少なくなっていくような)をします。

この「正規分布に従う」という前提で、平均値±3σの間には、全体の、99%強 が含まれるというのが、統計的に知られています。
これを以て、3σで管理という事になります。


さて、「管理図」ということですが、いろいろな種類のものがあります。
そこで、普通は、UCL, LCL は、製品自体の規格値(か、それから算出された値)を使うので、直接、3σは出てこない気がするのですが。
考えられるのは、x-s (平均と、標準偏差の管理図)で、標準偏差に対する上限管理値が3σなのかなと。(この場合、下限の管理値はありません。0が理想なので)

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q3σってエクセルで求められますか?

数学苦手なんですけど、エクセルで任意のデータに対しての
3σって求める事が出来るんですかね?
3σの算出ってのも、あまり意味が判らなくて書いてますけど・・・。
こんな質問の仕方で申し訳ありませんが、
意味が理解できて、なおかつ回答できる方いらっしゃいませんか?

Aベストアンサー

σは標準偏差ですね。
STDEVとか、そんな感じの関数です。
関数のグループで言うと統計の分類に入っています。
(母集団の全体とか、一部とか微妙に設定の異なる
種類のが居ます。)

3σってのは、規格の公差をσで割って、さらに3で
割ったものです。(公差が両側規格の場合。片側規格
の場合は、平均値と下限or上限と平均の差をσで割って
3で割ります。)

3σの意味とか、使い方は別途、工程能力指数って奴を調べてみてください。

通常、3σが1.3以上で量産性があると判断し、1.0以上で”頑張れば量産できるんじゃない”ってレベルです。
量産性がない場合は「検査で死ぬほど頑張れ!」とか
「製造は死ぬ気で工程を改善しろ」とかいうことになります。(泣)

Q±4σに入る確率について教えてください

ウィキペディアの検索より、
確率変数XがN( μ, σ2)に従う時、平均 μ からのずれがσ以下の範囲にXが含まれる確率は68.26%、2σ以下だと95.44%、さらに3σだと99.74%となる。
と分かりました。

そこで
4σ、


の場合確率はどうなるか教えてください。
よろしくお願い致します。

Aベストアンサー

Excel で NORMDIST を使い、平均 50、標準偏差 10 (いわゆる偏差値)で計算してみましたら、次のようになりました。

 σ 0.682689492137086
2σ 0.954499736103641
3σ 0.997300203936740
4σ 0.999936657516326
5σ 0.999999426696856
6σ 0.999999998026825
7σ 0.999999999997440
8σ 0.999999999999999
9σ 1.000000000000000

Excelの関数の精度がどの程度のものか分かりませんが、9σで100%になりました。

QNをkgに換算するには?

ある試験片に40kgの重りをつけた時の荷重は何Nをかけてあげると、重り40kgをつけたときの荷重と同等になるのでしょうか?一応断面積は40mm^2です。
1N=9.8kgfなので、「40kg=N×0.98」でいいのでしょうか?
ただ、式の意味がイマイチ理解できないので解説付きでご回答頂けると幸いです。
どなたか、わかる方よろしくお願いします。

Aベストアンサー

こんにちは。

kgfはSI単位ではないですが、質量の数値をそのまま重さとして考えることができるのがメリットですね。


>>>
ある試験片に40kgの重りをつけた時の荷重は何Nをかけてあげると、重り40kgをつけたときの荷重と同等になるのでしょうか?

なんか、日本語が変ですね。
「ある試験片に40kgの重りをつけた時の引っ張りの力は何Nの力で引っ張るのと同じですか?」
ということですか?

・・・であるとして、回答します。

40kgのおもりなので、「おもりにかかる重力」は40kgfです。

重力は万有引力の一種ですから、おもりにも試験片にも、地球からの重力はかかります。
しかし、試験片の片方が固定されているため、見かけ、無重力で、試験片だけに40kgfの力だけがかかっているのと同じ状況になります。

試験片にかかる引っ張り力は、

40kgf = 40kg×重力加速度
 = 40kg×9.8m/s^2
 = だいたい400N

あるいは、
102グラム(0.102kg)の物体にかかる重力が1Nなので、
40kg ÷ 0.102kg/N = だいたい400N


>>>1N=9.8kgfなので、「40kg=N×0.98」でいいのでしょうか?

いえ。
1kgf = 9.8N
ですね。


>>>一応断面積は40mm^2です。

力だけでなく、引っ張り応力を求めたいのでしょうか。
そうであれば、400Nを断面積で割るだけです。
400N/40mm^2 = 10N/mm^2 = 10^7 N/m^2
1N/m^2 の応力、圧力を1Pa(パスカル)と言いますから、
10^7 Pa (1千万パスカル) ですね。

こんにちは。

kgfはSI単位ではないですが、質量の数値をそのまま重さとして考えることができるのがメリットですね。


>>>
ある試験片に40kgの重りをつけた時の荷重は何Nをかけてあげると、重り40kgをつけたときの荷重と同等になるのでしょうか?

なんか、日本語が変ですね。
「ある試験片に40kgの重りをつけた時の引っ張りの力は何Nの力で引っ張るのと同じですか?」
ということですか?

・・・であるとして、回答します。

40kgのおもりなので、「おもりにかかる重力」は40kg...続きを読む

Q統計学的に信頼できるサンプル数って?

統計の「と」の字も理解していない者ですが、
よく「統計学的に信頼できるサンプル数」っていいますよね。

あれって「この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる」という決まりがあるものなのでしょうか?
また、その標本数はどのように算定され、どのような評価基準をもって客観的に信頼できると判断できるのでしょうか?
たとえば、99人の専門家が信頼できると言い、1人がまだこの数では信頼できないと言った場合は信頼できるサンプル数と言えるのでしょうか?

わかりやすく教えていただけると幸いです。

Aベストアンサー

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。
 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル(比べるための基準となるサンプル)を比較するときに、そのサンプルの分布が正規分布(正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式)でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。それ以下では、いくらデータに差があるように見えても検定で差を検出できません。
 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合(分散値)、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された(差を出すために)必要なサンプル数だけサンプルデータを集めれば、差があると判定されます(すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる)。よって、集めるサンプルの種類により、計算上出された(差を出すために)必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。

 具体的に例示してみましょう。
 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。一見すると後者のほうが値が大きく、前者と差があるように見えます。そこで、差を検定するために、t検定を行います。結果として計算上差があり、前者と後者は計算上差がないのにあると間違えて判断する可能性の許容値(有意確率)何%の確率で差があるといえます。常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。
 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0.8とした場合に5.7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。有意確率5%で差があるとはいえない結果になります。この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551.33となり、552個もサンプルを抽出しないと差が出ないことになります。この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。

 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲(小数点何桁レベルの誤差)に納まるようなサンプル数を算出していると考えます。テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。

> どのような評価基準をもって客観的に信頼できると判断・・・
 例えば、工場で作られるネジの直径などは、まったくばらつきなくぴったり想定した直径のネジを作ることはきわめて困難です。多少の大きさのばらつきが生じてしまいます。1mm違っても規格外品となります。工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。しかし、製品をすべて調べるわけにはいきません。そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。
 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。
 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。

 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。
 ただ、経験則上指標的なものはあります。正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない(それ以下でも問題ない場合もある)とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。でも、あくまでも指標です。

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な...続きを読む

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q「ご連絡いたします」は敬語として正しい?

連絡するのは、自分なのだから、「ご」を付けるのは
おかしいのではないか、と思うのですが。
「ご連絡いたします。」「ご報告します。」
ていうのは正しい敬語なのでしょうか?

Aベストアンサー

「お(ご)~する(いたす)」は、自分側の動作をへりくだる謙譲語です。
「ご連絡致します」も「ご報告致します」も、正しいです。

文法上は参考URLをご覧ください。

参考URL:http://www.nihongokyoshi.co.jp/manbou_data/a5524170.html


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング