プロが教える店舗&オフィスのセキュリティ対策術

Aが、Bと同等であることを示したいです。

A及びBは正規分布を示し、Bはμ=100、σ=1.0という前提です。

Aを5個測定して、Bの99%信頼区間に入れば、BはAと同等であると言いたいのですが、その場合、危険率は5%となります。

測定結果が信頼区間から外れる確率は5%あるので、判定基準を5個中、5個としてしまうと厳しい判定だと思います。
そこで、6個中、5個が99%信頼区間に入ればAはBと同等と結論付けたいと思いますが、これでは判定が緩すぎると言われる不安があります。

測定のn数はこれ以上増やせません。
6個中、5個でOKとすることについて、どのように理論だてれば良いでしょうか?
また、1個は外れ値が出てもOKとすることを前提として、「6個中、5個が99%信頼区間に入る」の代案がありましたら、ご教示お願いいたします。

A 回答 (3件)

χ二乗検定は?

    • good
    • 0
この回答へのお礼

どうもありがとうございました。
参考になりました。

お礼日時:2013/07/28 09:22

> Aを5個測定して、Bの99%信頼区間に入れば、BはAと同等であると言いたいのですが、その場合、危険率は5%となります。



99%信頼区間とありますが、母平均の信頼区間ではないですよね。
多分、Bの分布の99%を覆う区間のことを言っているのだと思いますが、それを信頼区間とは呼ばないでしょう。

さて本題ですが、もしAがBと同じ分布であるなら5個のデータがすべてBの99%区間に入る確率は0.99^5=0.95099なので、確かにほぼ有意水準5%の検定になります。
一方6個中5個以上とすると0.99^5*0.01*6+0.99^6=0.99854なので、有意水準0.146%の検定になります。
データ数が異なるので一概には言えませんが、有意水準を小さくとると検出力は悪くなるので、判定が緩すぎると言われる可能性がありますね。
でしたら、99%区間ではなくもう少し狭めて有意水準を5%となるようにしては如何でしょうか?
0.93715^5*(1-0.93715)*6+0.93715^6=0.95000

しかし、この方法ではAとBが同じ分布であるという検定にはなりませんね。
平均と分散が異なっていてもBの99%区間に入いる確率が99%である分布を考えてみてください。

もし、「A及びBは正規分布を示し、Bはμ=100、σ=1.0という前提」が確かならば、Aのデータから標本平均と標本分散を計算し、μ=100、σ=1.0かどうか検定した方が良いように思います。
このとき、個々の検定の有意水準は2.5%とします。
データ数は多い方が良いので5個よりは6個ですべきです。

あと付け加えると、同等性の検定について調べてみることをお勧めします。
簡単に説明すると、統計的仮説検定は同じであるということが基本的にはできません。
そこで、ある程度以上の違いを十分な検出力で検出できるように検定し、その結果有意でなければ、帰無仮説を支持しようというのが同等性の検定です。
    • good
    • 0
この回答へのお礼

詳細にご説明下さいまして本当にありがとうございました。

「多分、Bの分布の99%を覆う区間のことを言っているのだと思いますが、」
⇒そのとおりです。
「それを信頼区間とは呼ばないでしょう。」
⇒そうなのですか。統計の初心者なので、用語の定義をよく理解していませんでした。
99%区間という表現が適切なのですね。ご指摘ありがとうございます。

「0.93715^5*(1-0.93715)*6+0.93715^6=0.95000」
⇒このように計算すればよいのだと初めて知りました。
とても参考になりました。

「Aのデータから標本平均と標本分散を計算し、μ=100、σ=1.0かどうか検定した方が良いように思います。」
⇒この部分まで理解できました。なるほど。

同等性の検定及び捕捉して下さった内容については、私の知識不足のため、なんとなくしか分かりません。もう少し参考書を読んで勉強してみます。

計算式もお示しくださって詳細にご説明頂きましたこと、感謝申し上げます。

お礼日時:2013/07/28 09:20

#2の修正



> このとき、個々の検定の有意水準は2.5%とします。

このとき検定の多重性を考慮し、個々の検定の有意水準を2.5%と設定することで、全体の有意水準を5%に抑えます。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!