同等性の検定について

Question

現在、無作為の抽出した物の同等性の統計をどうしたらよいか困っています。

比較したいグループが５グループ有り、それぞれにかなり多くのデータを持っています。
そこで、そこの中から、１０００個ずつ無作為に選択しました。

これらのグループはそれぞれが同じである事を証明したいと考えています。
差がある検定なら、色々あるのですが、差が無い（どのグループも同じ）と言うにはどうしたらよいでしょうか？

統計学の初心者ですので、分かりやすくお教えいただければ幸いです。

かなり漠然とした質問になっているかもしれません。
ご意見・ご指摘を頂戴しましたら、その都度お答えさせていただきますので、宜しくお願いいたします。

quaestio · Accepted Answer

かなり長い回答になってしまいました。（計算間違いをしてなければいいのですが…）わからないところがあれば補足してください。 > 教えていただいたURLを拝見させていただいたのですが、この検定の内容は分かったのですが、計算式については素人なので、何が何だか良く分かりませんでした。複雑な数式がいきなり出されても、わからなくとも当然のことと思います。 > しかし、一般的な統計ソフトに搭載されているとお聞きしたので、安心し飛ばしたのかもしれません。もし統計ソフトを現在持っていないのなら、Rを使ってみてはいかがでしょうか？ GUIではないので少しとっつきにくいかもしれませんが、フリーソフトです。統計ソフトRのサイト　　　 http://www.r-project.org/ 日本語の使い方のサイト　　http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html Rでは、次のようにコルモゴロフ-スミルノフ検定ができます。 Rをダウンロードして、実際にやってみるといいでしょう。頭に#がついているものは、コメントです。 ### ここから下のコマンドを1行ずつ実行してみましょう。 ### # 標準正規分布に従う乱数を10個発生させ、xに保存する。 x <- rnorm(10) # 平均が１、標準偏差が２の正規分布に従う乱数を10個発生させ、yに保存する。 y <- rnorm(10, mean = 1, sd = 2) # x, yの中を見てみる。 x y # 私の環境ではx, yはこういうデータになりました。 # > x # [1] -0.8269207 0.7099844 -0.7690119 -0.6518651 -0.4547607 0.3805563 1.2568745 -0.5716070 -0.8341094 -0.1228892 # > y # [1] 7.9536764 0.3226898 -2.3892380 3.0687527 1.5419668 -0.6778318 0.5084741 1.5935735 1.6216679 2.7330914 # コルモゴロフ-スミルノフ検定 ks.test(x, y) # 上のデータでは以下の結果が出力されます。 # Two-sample Kolmogorov-Smirnov test # # data: x and y # D = 0.6, p-value = 0.05245 # alternative hypothesis: two-sided # 有意水準5％では棄却されませんでした。 ### 実行はここまで ### > この検出力、今まであまり聴いたことが無く、少し調べてみると、異常を判断する力とかかれており、いまいちピンときません。 > 申し訳ないのですが、検出力に関して噛み砕いてご説明いただけないでしょうか？さて次に検出力についてですが、検定には第一種の過誤(Type I error)、第二種の過誤(Type II error)の2種類の誤りがあるのは理解されているでしょうか？第一種の過誤は、帰無仮説が正しい場合に誤って棄却されてしまうことで、第二種の過誤は、対立仮説が正しい場合に正しく棄却されないことです。検出力(power)は、1-(第二種の過誤)で定義されます。つまり、検出力とは対立仮説を正しく棄却する確率のことです。 > そして、検出力がわかった所で、何が分かるのでしょうか？例えば、表の出る確率が0.55であるコインがあったとしましょう。通常、この表の出る確率は未知ですので、このコインの表の出る確率が1/2かどうかを知りたいとします。コインを投げる回数はとりあえず10回としておきましょう。帰無仮説は「コインの表が出る確率は1/2である。」で、対立仮説は「コインの表が出る確率は1/2ではない。」となります。コインの表の出た回数が1以下か9以上なら帰無仮説は棄却されますしかし、表の出る確率は0.55なので、コインの表が1以下か9以上になる確率は0.02775935で、これが検出力になります。つまり、0.55-0.5=0.05という差はコインを10回投げた程度では検出できないということです。さて何度もいわれているように、統計は違いを見つけるには便利なのですが、通常の検定では同じであることがいえません。それでは不便ですので、どうにかして同じであることを示したいことがあります。コイン投げでもサイコロでも何でもいいのですが、表がでる確率が1/2のコインやそれぞれの目がでる確率がどれも等しく1/6であるサイコロは現実には存在しておりません。しかし、それを理由にコイン投げをやめたり、サイコロを使わなかったりすることがあるでしょうか？おそらく誰もがある程度の差は許容しているはずです。同等性の検定は、検定を実施する前に許容できる差（それ以下なら同じとみなす差）とその差をどの程度の検出力で検出したいかを設定し検定を行い、その結果、棄却されなかったら同等であるとみなし、棄却されたら違うと結論付けます。また、先ほどのコイン投げの例で説明します。そして、このコインの表のでる確率が1/2であるかを有意水準5％、0.5から±0.01以上の差を検出力90%で検出できる検定することを考えます。コインをn回投げたと仮定すると、帰無仮説ではnが正規分布近似ができる位大きいとすれば95％の確率で0.5-1.96/2/sqrt(n)から0.5+1.96/2/sqrt(n)の範囲で表が出ます。表がでる確率が0.49の場合に0.5-1.96/2/sqrt(n)から0.5+1.96/2/sqrt(n)の範囲外になる確率が90％になるようなnを求めます。表がでる確率が0.51の場合に0.5-1.96/2/sqrt(n)から0.5+1.96/2/sqrt(n)の範囲外になる確率が90％になるようなnも求める必要があるのですが、分布が0.5を中心に対称なので計算の0.49の場合だけを求めるだけでよい。また、0.49の場合に求めたnなら0.5±0.01の範囲外のどの値でも、検出力90％を確保できていることに注意してください。こうして求めたn回以上（上の例では26228回以上）、コインを投げれば、このコインの表がでる確率が0.5であるか否かをはっきりと結論付けることが可能となります。（勿論有意水準5％、0.01以上の差を検出力90％でという条件がありますが） > また、この検出力ですが、今回教えていただいたコルモブロフースミルノフ検定に用いるのでしょうか？ > それとも、No.1～３で教えていただいていたウェルチの検定に用いるのでしょうか？上の説明からもわかるかと思いますが、どんな検定でも検出力を考えることができます。コルモゴロフ-スミルノフ検定でもいいし、ウェルチの検定でも原理的には使うことはできます。ただ、検出力の計算が結構難しいのです。カイ二乗検定、F検定やt検定ならテキストを知っているのですが、コルモゴロフ-スミルノフ検定ですと私の手には負えそうにありません。テキスト　　永田靖, サンプルサイズの決め方, 朝倉書店(2003) > 例えば、両方に用いた場合（同じように用いれるのかどうか分かりませんが、）違いが生じるかもしれませんが、その違いはどのように考えたらよいのでしょうか？これは比較しているものが異なるので、違いが出てもおかしくは無いでしょう。（コルモゴロフ-スミルノフ検定は分布の位置と形の差を見るものですし、ウェルチの検定は平均の差を見ていますので）

kgu-2 · Answer

>○○水準○％以下の検定値を得たので、AとBには差がない！」などとできない物かと単純に考えていました。
 教科書の信者は、想いつかないので、私は好感を持てました。といっても、No1で書いたように、私もどっぷりつかりましたから、自己弁護もあるでしょうが。もがいてもがいて、その結果たどりついたのは、2つの集団で差がない、というのは現実にはありえない。統計学がそこから出発しているのなら、「差がない」の証明は不可能、ということです。
　有意差も、5%とか1%とかで判定します。1%であっても、100回に１回は、有意差あり、の結論は間違いかもしれない、が目をつむろう、と決め(誰がきめたのかは知りません)、それを他の人も認めた、それが統計学の世界です。
　差が無いも、平均値に5%あるいは1%の差なら、「差がない」と決めてしまえば、その検定は簡単です。ただし、私が提案しても、誰も賛同・納得してくれない、と思います。また、現実には、5%どころか1%の差でも、困る人も多いので、何%で差がないと判定するのか、の基準が困難でしょう。
　ついでに書いておけば、有意差は1%の危険性は許されます。が、私が「浮気をしていない」と１００回返答をして、１回は、浮気をしていないか、したのかが不明では、家内は許さないと想います。

>実際、ｐ値に０．８８や、０．２５などの数字が出た場合に、この数字には何かしらの意味があるのでしょうか？
 最近のパソコンは、危険率を簡単に計算できるので、p<0.0001なんぞの記述を見ますが、全く意味がありません。
　5%と1%は、統計学の約束事。制限速度60kmのところで、80でも100でも200でも、違反は違反、です(スピード違反は罰金の額が違いますが)。「誰もはしっていないから、100kmにしろ」と言っても、誰も見向きもしないでしょう(公安委員会の偉いさんになれば可能かも)。

>棄却できなかったからと言って、０．９も０．１も同じと扱ってよい物でしょうか？
　検定の場合、「有意差がみられない」は、統計学的には無価値です。統計学的には、五十歩百歩で同じです(五十歩と百歩では違う、という人もいますが)。

 繰り返しになりますが、統計学(正式には推測統計学)による検定゛の目的は、「有意差あり」の証明であり、主張できるのは、「有意差あり」の結論だけ。「差がない」(第2の罠)、「差が大きい」(第3の罠?)は、統計学では証明・主張・記述できません。
 　平均値が10.0と10.01なら、「差は、0.01だった」までは事実なのでデータの科学的です。「ほとんど差がない」という表現は、統計学では証明できません。しかし、本人の感想・考えを拒否はできないので、学問の世界での主張は自由です。ただ、他の人を説得できるかどうかは、全く別の次元の問題です。

　ただ、私の考えは、教科書とは少し違うかも。というよりも、教科書で書いていない部分です。
　正否の判断は、ご自身で。

quaestio · Answer

5つの標本の分布が全て同じであることを検定したいのですね。

それでしたら、コルモゴロフ-スミルノフ検定(Kolmogorov-Smirnov test)を用いたらどうでしょうか？
検定方法については参考URLをご覧ください。
（日本語版Wikipediaにも項目がありますがあまり参考になりません。）
一般的な統計ソフトなら、コルモゴロフ-スミルノフ検定ができると思います。

ただし、コルモゴロフ-スミルノフ検定は2標本までしか検定できませんので、5つも標本があると多重比較を行わないといけません。
そうなると、検定の多重性の問題が生じますので、有意水準を全体で目的の値以下になるように調整しないといけません。
これについても参考URLをご覧ください。

言うまでもないでしょうが、No.1～3でも書かれているように、コルモゴロフ-スミルノフ検定で帰無仮説が棄却されなかったとしても分布が同じといっているわけではありません。

あと、No.3での補足質問に関してですが、検出力について調べてみてください。

参考URL：http://en.wikipedia.org/wiki/Kolmogorov-Smirnov_test, http://ja.wikipedia.org/wiki/%E6%9C%89%E6%84%8F

kgu-2 · Answer

>グループの同一性
 検定の目的は、同じグループから抽出したサンプルにしては、差がありすぎる、偶然にこんな差があるとは考えられない、だから「有意差あり」を出すのが目的。言い換えると、差がない(＝同じである)、の表現を使うのは、誤りです。
　この根拠は長らく見つけられず、どこでも書いてなかったのですが、ようやくNo1で書きこんだように、平均値に、1であろうが0.001であろうが、差は差。すなわち、全サンプルを検査し、その平均値が完全に一致しない限り、「差はある」という事実から、「差は無い」という結論は出せない、と悟りました。平均値A群は10g、B群も10g、だから差はない、と主張しても、もうひと桁測定したら、どうなる、と質問されると、反論できません。
　繰り返しになりますが、母集団のデータを全て使用すれば、必ず差があります。そこから抜き出したサンプルを使って検定をするのは、母集団のでデータが多すぎるとか、蛍光灯の寿命のように全部を使うと売る物が無くなるとかの理由で、母集団の代わりにするためです。母集団に差があるのなら、その代りにも、差があるのは当然で、同一の証明は無理です。

　ウェルチの検定は、平均値の差の検定ですが、分散が同じと違う場合で、検定の方法(判定の式?)異なるようです。そこで分散が同じ、と判定しているハズなのですが、この部分の利用ができるかもしれない、とアドバイスしました。

　回帰分析は、秤AとBの性能は同じか、の場合には適用できます。
品物1、2、3、・・・について、秤AとBで測定する。Aの値とBの値の交点に点を打つ。この天の集まりが、1本の直線(曲線でもOK)になりやすいほど、一致度が高い、という手法をとります。「同じある」ことに論究できるのは、回帰分析しか知りません。
　書き込みを読んだ限りでは、回帰分析に持って行けないような印象があります。お役にたちそうもありませんが。

>重さを量って、結局このお菓子の袋には行っている物はみんな同じぐらいと言う事を言いたいのだと思います
 このお菓子は、この袋から出した物と考えてよいか、というのなら、普通の検定です。
1) 袋の中からサンプルを取り、平均と標準偏差(σ)を求める
2) 平均±２σ(有意水準５％の場合)の範囲なら、同じ袋と判断
　というのは、ありますが。

　Aの袋とBの袋のお菓子の重さは、同じと考えてよいか、というのは、統計学ではできません。全てのお菓子の重さを量れば、1.0にせよ、0.001にせよ、平均値に差があるからです。

kgu-2 · Answer

失礼な書き方をして、申し訳ありません。
　統計学の書き込みでは、学生が卒論などで、指導教授の許可もなく、アイデアが盗まれる危険性も考慮せず、もちろんアドバイスに対する「謝辞」の配慮もなく、・・・、というのが多いので。

No1です。事情は、理解しました。
　私が浮かんだのは、「宝くじの確率は、同じである」で、悪戦苦闘したことがあります。○の次に、×がくる確率をプログラムするのに、どことなく似ている気がするのですが。

　同等性の検定は、一つだけその判定をしている検定法があります。2群の平均の有意差判定に、ウェルチの方法があって、検定の前提に、分散の同一性の判定があります。私は、『分散が違っていれば、別のグループ』、それは、2群が違うのだから、検定以前にグループ間で差があるのは明白、有意差ありだろう、ということで、この方法を使ったことはありません。
　実際に、どのように同じと判定しているのか知りませんが、統計学の教科書で、グループの同一性の判定をしているのは、これ以外に読んだことがありません。初心者ですので、『似たようなものはないか』と、本はアレコレひっくり返していますが。

　回帰分析をご存知なら、標準液の濃度と測定値、あるいは一定時間後の値と測定値、のように、2次元のデータで表せるなら(データを散布図にできるなら)、回帰分析の相関係数(私は決定係数を使いますが)で、一致度なら判定できると考えます。
　学生時代に、「データは、検定法を考えてから収集」の授業を受けたとき、その意味がわからなかったのです。が、この場合も、散布図として表わせるようなデータに変換できるなら、回帰分析でしょう。

>以前の研究の時は先輩にも「そんな統計無いじゃない？」と言われた事があるので…
 検定の目的は、「有意差あり」を見つけること。当然でしょう。
 回帰分析も、相関係数からt検定をして、こんなに相関係数が高くなるのは偶然ではない、と判定して、一致すると結論するわけけですから。

　乱数表からのデータだと、傾向がないので、回帰分析は無理でしょう。
　乱数表でデータを得られれば、同一性は、検定するまでもない、というのが数学の常識では。そうでないと、乱数表を利用する意味がありません。
　ただ、乱数表は無限、が前提。少数例は、異なるのも同然。乱数表での少数例の差異(実際の確率)、なんぞで論文がかけるかも。ただし、少数例を増やせば無限に近くなるので・・・。
　釈迦に説法の点は、ご容赦を。

　以上、お役にたちませんが、同一性、差がない、というのは、私の能力以上に、統計学の限界だと考えいてます。

kgu-2 · Answer

>差が無い（どのグループも同じ）と言うにはどうしたらよいでしょうか？
 ありません。
　たとえば、1000個のデータについて、Aグループは10.00002±0.5、Bグループは10.00003±0.5、の場合、差があるのか、無いのか、ということです。数学的には、0.00001の差が平均値にはあります。ほんの僅かでも、差は差、です。グループごとにこの程度の差はあると推定されるので、「差が無い」という結論は無理なのです。
　有意差のように、1％以内なら差はない、と学者が決め、世間が認めれば別ですが。しかし、現実の社会では、1%の差が許される場合と、0.001%でも許されない機器もあり、統一できるとは想えません。

　例外的に、一致するか否かを検定する方法があります。回帰分析ですが、データが分からないので利用できるか否かは、判断できません。
　データを提示される前に、
1) お立場を書いて下さい。学生のなのか、個人の趣味なのか
2) 卒論など、指導者がおられるのなら、インターネットでの助言をOKされているのかどうか。
3) 2)がイエスの場合、もう一つ質問がありますが、。

　それと、内容を書かれると、「研究を盗まれた」という可能性も否定できませんので、その覚悟はしていて下さい。学生がこのような書き込みをすると、「私の学生なら追放」と断言しています。

>統計学の初心者ですので
 初心者が陥る第一は、データがあるので、なんとかしてくれ。第二は、「差がないことを示したい」で、私が「初心者の罠」と呼んでいるのに、首までつかっています。
　第一の罠は、検定法に合わせてデータを収集する、のが常道です。こんなデータなら、この検定法が使えるのに、というのは多いので。ただ、なんとかなる場合が多いのですが。
　第二の罠は、統計学の教科書から抜け出すときに、誰しも陥るようです。私が、差がないことは証明できない、と言えるようになるまで、たぶん2年くらいかかりました。どこにも書いていないので。

　偉そうに書きましだか、私も初心者です。多重比較はできません。賢くないので、初心者がどこで躓くのか、だけはタップリ経験し、どこが分かりにくいのかだけは理解しています。

同等性の検定について

かなり長い回答になってしまいました。

>○○水準○％以下の検定値を得たので、AとBには差がない！」などとできない物かと単純に考えていました。

5つの標本の分布が全て同じであることを検定したいのですね。

この回答への補足

>グループの同一性

この回答への補足

失礼な書き方をして、申し訳ありません。

この回答への補足

>差が無い（どのグループも同じ）と言うにはどうしたらよいでしょうか？

この回答への補足

似たような質問が見つかりました

このQ&Aを見た人はこんなQ&Aも見ています

関連するカテゴリからQ&Aを探す

このQ&Aを見た人がよく見るQ&A

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング