アプリ版:「スタンプのみでお礼する」機能のリリースについて

統計学についてです。

抽象的で申し訳ないのですが、母平均の検定において、帰無仮説はなぜμ= μ0のように等号で仮定しないといけないのですか?

μ ≦μ0のように不等号で仮定することはできないのですか?

どなたか教えていただけるとありがたいです。

質問者からの補足コメント

  • #2の「お礼」に関する補足です。

    「統計学についてです。 抽象的で申し訳ない」の補足画像1
      補足日時:2019/07/16 10:49
  • 帰無仮説をμ = μ0とすると
    右側検定における対立仮説はμ > μ0
    左側検定における対立仮説はμ < μ0
    となると思いますが、これが理解できません。

    つまり、分布の左右と母平均の大小の関係がわかりません。
    z値やt値の式より、分子が(標本平均)-(母平均)なので、母平均が大きくなるにつれて値は小さくなる(つまり、分布では左にいく)ような気がするのですが…

    これについてご教授いただきたいです。

      補足日時:2019/07/20 09:11
  • 何度も何度も申し訳ないのですが…

    >「得られた50個のサンプルの寿命の平均値が 150 時間を越えていれば、帰無仮説で仮定した分布以外(帰無仮説で仮定した分布よりも「右に寄った分布)から採取したサンプルである確率が 95% 以上」

    150時間を超えていれば→帰無仮説で仮定した分布よりも右に偏った分布

    この「150時間を超える→右」

    という対応関係がわからないのです…

      補足日時:2019/07/20 16:23

A 回答 (5件)

No.3 です。

#3 の「お礼」と「補足」に書かれたことについて。

>これに関連してなのですが右側検定、左側検定の意味について質問させてください。

「右」「左」が何を意味しているのかを理解できれば分かると思います。

ここでいう「右」「左」は、#2 で「補足」に追加された手書きの図でいうところの「斜線」を引いた「棄却域」が右にあるか、左にあるか、あるいは「両方にあるか」(その場合には「両側検定」)ということです。


>帰無仮説をμ = μ0とすると
>右側検定における対立仮説はμ > μ0
>左側検定における対立仮説はμ < μ0
>となると思いますが、

違います。
対立仮説には関係なく、
帰無仮説をμ = μ0とすると
右側検定は「限界値よりも大きければ棄却」(つまり棄却域は 1.65σ 以上(右側 5%)だったり1.96σ 以上(右側 2.5%)だったり)
左側検定は「限界値よりも小さければ棄却」(つまり棄却域は -1.65σ 以下(左側 5%)だったり -1.96σ以下(左側 2.5%)だったり)
ということです。

それは、対立仮説(本来採択したい仮説)が何であろうが関係ありません。(μ > μ0 であろうが μ < μ0 であろうが μ ≠ μ0 であろうが)


たとえば、ある製品の「寿命」であれば、
・対立仮説(採択したい仮説):寿命は 150 時間超
・帰無仮説(検定で「仮定」する仮説):寿命は 150 時間以下
とすることになります。
ただし、「寿命が 150 時間以下」ということでは検定できないので、現実には「50個のサンプルを採ってきたときに、その寿命の平均値が 150 時間以下」として、
「50個のサンプルを採ってきたときに、その寿命の平均値の 95% 信頼区間の上限値が150 時間(たとえば 120~150 時間)」
といった条件で検定します。
この場合には、
「得られた50個のサンプルの寿命の平均値が 150 時間を越えていれば、帰無仮説で仮定した分布以外(帰無仮説で仮定した分布よりも「右に寄った分布)から採取したサンプルである確率が 95% 以上」
とするのです。

この場合には、
「得られた50個のサンプルの寿命の平均値が 120 時間未満であれば、帰無仮説で仮定した分布以外(帰無仮説で仮定した分布よりも「左に寄った分布)から採取したサンプルである確率が 95% 以上」
という検定もできますが、「寿命が長い」ことを検定したいのでこちら(「左側検定」)はやっていないだけです。


別な例で言えば、ある製品の寸法の製作精度が 1% 以下と決まっているとします。つまり設計寸法が A mm の場合
 0.99A (mm) ≦ X ≦ 1.01A (mm)
だったら合格ということです。つまり「大きすぎても、小さすぎても不合格」です。
この場合の検定は「両側検定」になります。

一方、ある製品たとえば「食料品」のような場合で、重量の製作精度が 1% 以下と決まっているとします。この場合には、公称重量が A g の場合
 0.99A (g) ≦ X ≦ 1.01A (g)
だったら合格かというと、0.99A (g) の人は「不足している」とクレームするし、1.02A (g) の人は「得をした」ということで文句は言わないでしょう。この場合には、たとえば「公称重量:A (g) に対して、製作目標値 B = 1.01A (g) を設定して、製品を
 0.99B (g) ≦ X
で管理する」などとするでしょう。つまり「小さすぎる方は不合格」ですが「大きすぎる」方は不合格とはしないことが多いと思います。
この場合に製品の抜き取りをして検定する場合には「左側の片側検定」になるでしょう。

「重さで買う製品」の場合は上のようなことですが、「車の排出ガス濃度」のような場合には「大きすぎる方は不合格」で「小さすぎる」方は合格でしょう。

このように、「両側・片側」、片側の場合の「右側・左側」は、#1 の最初に書いたように

「帰無仮説の設定内容は、何を検定したいのかという検定の内容によります」

ということに尽きます。見かけ上の「右だ左だ」に惑わされないことです。
    • good
    • 1
この回答へのお礼

ベストアンサー出すのが遅れてしまいすみません…
ようやく理解できました。
長々とお付き合いいただきありがとうございました。

お礼日時:2019/07/22 22:23

企業でSQCを推進する部署の者です。



話が収束しつつありますが、追加させて下さい。これまでの話からそれてしまって恐縮です。

No.1、No.2で、回答者さんが書いてみえますが、帰無仮説をμ<μoとすべき場合があります。

それは帰無仮説を否定したいときに使います。差があることを否定したい検定とは、「非劣性の検定(片側検定)」「同等性の検定(両側検定)」です。

例えば、ジェネリック医薬品の薬効がμ、原薬の薬効がμoのとき、同等性を言いたいのであれば、対立仮説の方をμ=μoとします。

なお、この検定は、第一種の過誤αではなく、第二種の過誤βを使った検定になります。


おせっかいですが、

μoの添え字について、ご質問者さん、添え字を間違えていますよ。ご使用の教科書がどうか知りませんが、ここは正しく覚えておきましょうよ。
・観測値の統計量(μやσ)は添え字なし。参照値は添え字o。originalの意。ネイマンピアソンの論文(1933)による。なお、ここは0でも良い。ゼロバイアスドの意。
・観測値の検定統計量(u、t、F)、例えばt値はto、添え字oはobserved(観測値のもの)の意。参照値のtは、t(0.05,φ)のように書かれる。検定統計量の添え字0は明らかな間違い。ゼロの意味が無い。
・帰無仮説はH0(ゼロ)=ナル・ハーパーセセスの意。ネイマンピアソンの論文(1933)ではoだったが、最近は数字。
・対立仮説は1から連番を振る。最近の論文では31ってのを見たことがあります。もちろん検定を多数行うと「多重比較」になるので、それなりの(テューキーとかボンフェローニとか)方法を使用すべき。男女で薬効が異なる、高齢者は薬効が異なる、既往症があると薬効が異なる、とどんどん対立仮説を増やしていくような場合です。
・論文に、このうち一つだけを取り上げて書く、というのはルール違反(ねつ造)です。よくネットに書かれていますが、論文の多くは、少し有意水準を変更すると有意でないケースが多いそうです。つまり、多重比較を考慮すると有意ではないのです。
    • good
    • 1
この回答へのお礼

回答していただきありがとうございます。
記号の使い方見直します。
助かりました。

お礼日時:2019/07/22 22:22

No.2です。

「お礼」および「補足」に書かれたことについて。

>ここに関連してなのですが、例えば帰無仮説として「寿命の"平均値"が150時間以上」と言う母集団を考える場合
>μ0≧150
>とすることができ、補足の写真のように計算できるということになりますよね?

はい。

「補足」の図が何を言いたのかよく分かりませんが、
・ある n 個のサンプルを採ってきて、その平均 Xbar から確率変数 t を
  t = (Xbar - μ)/√(σ^2 /n)    ①
上のように求めた。
・母平均が μ ≧ 150 であれば
  Xbar - μ ≦ Xbar - 150
なので、
  t ≦ (Xbar - 150)/√(σ^2 /n) = t0
になる。
・これが下のようなグラフの斜線部分である。
ということでしょうか?

でも、その場合の t0 の意味って何ですか?

通常考える場合には、①の分布の「母平均」を
 μ = μ0 (「寿命が150時間以上と言う母集団」の寿命の平均値)    ②
として
 t = (Xbar - μ0)/√(σ^2 /n)    ①'
の分布を考え、これが「正規分布する」としたときに「信頼度95%(有意水準 5%)」に入る t の範囲を「標準正規分布表」から読み取って
 -1.96 ≦ t = (Xbar - μ0)/√(σ^2 /n) ≦ 1.96
これを変形して、左半分の不等式から
 -1.96√(σ^2 /n) ≦ Xbar - μ0
→ μ0 - 1.96√(σ^2 /n) ≦ Xbar
右半分の不等式から
 Xbar - μ0 ≦ 1.96√(σ^2 /n)
→ Xbar ≦ μ0 + 1.96√(σ^2 /n)
両方合わせて
 μ0 - 1.96√(σ^2 /n) ≦ Xbar ≦ μ0 + 1.96√(σ^2 /n)    ③
となり、この「下限値」を
 -t0 = -1.96√(σ^2 /n)
と考えますが、それでよろしいですか?

つまり、①' で正規分布する「n 個のサンプルの平均値」は、確率 95% で②の範囲に出現するということです。
逆にいえば、③の下限値以下になる、つまり t≦-t0 となる確率が 2.5% ということです。(t0≦t となる確率も 2.5% で、合わせて「有意水準 5%」)

もし、その「n 個のサンプル」が「寿命が150時間以上と言う母集団」から採ってきたものであると仮定すれば、確率95%で③の範囲に入るはずであって、もしそのサンプルがグラフの斜線部分に入ったら、とても「寿命が150時間以上と言う母集団」から採ってきたものであるとはいえない、そのサンプルは「寿命が150時間未満の母集団」から採ってきたと考えるのが妥当だ、というのが「検定」です。

この辺の「検定」の考え方、その中での「帰無仮説」の位置づけを理解していれば、上の話のようになることはお分かりかと思います。


ちなみに、上の説明の中で、②の部分で元の質問である「μ = μ0」について触れていますので、合わせてご確認ください。

忖度するに、質問者さんは「母集団の平均」と「サンプルの平均」、それと例に出された「寿命の限界値」に相当する「サンプルから推定した母平均の信頼区間」(質問者団が「寿命の"平均値"の限界値」と考えているもの)の関係をごちゃごちゃに考えて整理ができていませんね?
    • good
    • 1
この回答へのお礼

回答していただいてから日数が経ってしまい申し訳ありません。

>忖度するに、質問者さんは「母集団の平均」と「サンプルの平均」、それと例に出された「寿命の限界値」に相当する「サンプルから推定した母平均の信頼区間」(質問者団が「寿命の"平均値"の限界値」と考えているもの)の関係をごちゃごちゃに考えて整理ができていませんね?

仰る通りです。
ここ数日は統計学を離れていて、今日もう一度考えてみたのですがやはり上手く整理ができません。

これに関連してなのですが右側検定、左側検定の意味について質問させてください。
これが理解できると整理される気がするので…
以下、補足に書きます。

お礼日時:2019/07/20 01:05

No.1です。

「お礼」に書かれたことについて。

>不等号についてなのですが
>例えば電球の寿命が150時間であることを疑ってかかる場合などです。
>僕はこの場合、帰無仮説を「電球の寿命は150時間である」と設定するよりも「電球の寿命は150時間以上である」と設定する方が自然に思えます。

これが、例えばメーカーが言う「寿命は150時間以上」ということを疑ってかかるのであれば、その命題そのもの「寿命は150時間以上」を帰無仮説にして否定・棄却できるかを調べればよいです。

逆に「寿命は150時間以上」であることを検定したければ、帰無仮説を「寿命は150時間未満」とすればよいのです。

いずれも
・上のケース:「寿命は150時間以上」という母集団を仮定して、得られたサンプルがその母集団から得られる確率を算出する。「有意水準」よりも小さい確率なら「あり得ない」として棄却する。
・下のケース:「寿命は150時間未満」という母集団を仮定して、得られたサンプルがその母集団から得られる確率を算出する。「有意水準」よりも小さい確率なら「あり得ない」として棄却する。
ということになります。

従って「μ ≦μ0」が帰無仮説になることもあり得ます。ただ、その場合に「母集団の平均」が「μ0 = 150時間」なのかどうかは内容によります。(「寿命が150時間以上」という母集団の平均は 「μ0 = 180時間」かもしれないし、あるいは「母平均の95%信頼区間の下限値が150時間」かもしれない)

ただそれだけのこと。それを #1 では

>帰無仮説の設定内容は、何を検定したいのかという検定の内容によりますが

と書きました。
いずれの場合でも、帰無仮説とした「母集団」の「分布とその母数」、つまり「正規分布」とかその「平均、分散」を仮定しないと検定そのものができません。(正規分布以外にも「t分布」とか「カイ二乗分布」などを使う場合もあります)


>ですが、教科書などでは前者の例しかなかったため疑問に思った次第です。

教科書には、最も分かりやすい #1 のような例を書いているということなのでしょう。
    • good
    • 1
この回答へのお礼

yhr2さん、回答していただきありがとうございます。
仰っている事は理解できたのですが、一つ気になることがあるので確認させて下さい。


> 「寿命が150時間以上」という母集団の平均は 「μ0 = 180時間」かもしれないし、あるいは「母平均の95%信頼区間の下限値が150時間」かもしれない

ここに関連してなのですが、例えば帰無仮説として「寿命の"平均値"が150時間以上」と言う母集団を考える場合
μ0≧150
とすることができ、補足の写真のように計算できるということになりますよね?

お礼日時:2019/07/16 10:48

帰無仮説の設定内容は、何を検定したいのかという検定の内容によりますが、通常は


「差がある」
ということを検定したいので、「差がない」というのが「否定したい帰無仮説」になることが多いです。

この「差がない」というのは「サンプルはこの母集団から採ってきたものである」ということなので、数式で書けば
 サンプルの平均 = 母集団の平均
ということです。
μ:サンプルの平均
μ0:母集団の平均
ですよね?

>μ ≦μ0のように不等号で仮定することはできないのですか?

その不等号は何を表わしているのですか?
    • good
    • 1
この回答へのお礼

回答していただきありがとうございます。

不等号についてなのですが
例えば電球の寿命が150時間であることを疑ってかかる場合などです。
僕はこの場合、帰無仮説を「電球の寿命は150時間である」と設定するよりも「電球の寿命は150時間以上である」と設定する方が自然に思えます。

ですが、教科書などでは前者の例しかなかったため疑問に思った次第です。

お礼日時:2019/07/15 10:06

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!