アプリ版:「スタンプのみでお礼する」機能のリリースについて

仮説検定と平均値の検定の違いがわかりません。

(1)ある製品を作る機械はその製品の重さが平均200g、標準偏差が4gの正規分布に従うようにセットされている。ある日、無造作に36個の製品を抜き出して重さの平均を調べたら、198gだった。機械は正常に作動していると言えるかを有意水準1%で検定せよ。

(2)ある病気の今までの治療法による治療率は25%であった。最近新しい治療法が導入され、患者103人中35人が治った。この新しい治療法によって治療率は改善されたと言えるかを有意水準5%で検定せよ。

(1)は仮説検定で、(2)が平均値の検定であり、その違いは分散が既知であるかどうかであると習ったのですが、文章中の標準偏差を二乗すれば両方とも標準偏差が求まりませんか???

質問者からの補足コメント

  • 訂正 例の門愛を載せ間違えてしまいました。すみませんでした。

    (2)
    40代前半の男性の最大血圧値は、平均130mmHg、標準偏差15mmHgの正規分布に従っているという。心筋梗塞の患者が多い地方で、40代前半の段英の最大血圧値が一般より高いかどうかを調べる田mに、50人を抽出し血圧を測定したら、平均は134mmHg出会った。有意水準5%でけんていせよ。

    正しいのはこちらの問題です。

      補足日時:2017/12/20 16:20
  • 訂正の訂正 誤字がありますね。すみませんでした。

    門愛→問題

      補足日時:2017/12/20 16:22
  • 訂正の訂正2 変換ミスがありますね。すみませんでした。

    出会った→であった
    けんてい→検定

      補足日時:2017/12/20 16:24
  • うーん・・・

    訂正後の(1)と(2)は全く同じ考え方で解いて良いのでしょうか。

    教科書の項目が分かれているため、疑問に思いました。

    ((1)の問題は「仮説検定:仮説検定の手順」という項目で、(2)は「仮説検定:平均値の検定(母分散が既知の場合)という項目で取り上げられています。)

      補足日時:2017/12/20 16:30

A 回答 (4件)

統計を中途半端にしか勉強していないということですね。


「仮説検定」と「平均値の検定」などという分類はありません。何かを検定したいときに、「平均値が等しいと仮定すると」とか「ばらつきが同じと仮定すると」という仮定をおくことを「仮説」といっているだけです。

>(1)は仮説検定で、(2)が平均値の検定であり、その違いは分散が既知であるかどうかであると習ったのですが、

多分、質問者さんが正しく理解していないだけだと思いますが、これが本当ならめちゃくちゃですね。

「検定」とは、なんらかの「確率分布」を使って、「統計的に通常起こりうる」(違いは統計誤差の範囲内であって、理由・意味はない=有意でない)か「統計的に通常起こり得ない」(違いは統計誤差では説明できず、理由・意味がある=有意である)かを調べるものです。

いちばん多く使われる「正規分布」では、正規分布の特性である、標準偏差を「σ」として、
  平均値± σ の範囲に、全体の度数の 68.3% が入る
  平均値±2σ の範囲に、全体の度数の 95.4% が入る
  平均値±3σ の範囲に、全体の度数の 99.7% が入る
という特性を利用します。
http://www.stat.go.jp/koukou/howto/process/p4_3_ …

まずは、この「正規分布」の特性と、基本的な「検定」を勉強してください。授業で使ったテキストを復習してもよいし、下記のようなサイトを参照してください。
「ハンバーガー統計」
http://kogolab.chillout.jp/elearn/hamburger/

お示しの例でいえば、次のようなことです。

(1)平均 200g、標準偏差 4g の精度分布なら、とり出した36個のサンプルの平均が 198g ということが統計的にあり得るか、ということです。「有意水準 1%で」ということは、確率99% で起こり得るかどうか、ということです。
 上の正規分布の特性から、σ側ではなく「全体の○○%」の方を基準にした言い方にすると
  平均値± 2.57σ の範囲に、全体の度数の 99.0% が入る
ということですから、この場合には
  200 g ± 2.57*4.0 g つまり 200 ± 10.28 g の範囲に、全体の度数の 99.0% が入る
ということになります。

「198 g」なら、十分その範囲内じゃないか、だったら「機械は正常に作動していると言える」とお考えかもしれませんが、それは間違いです。
1個サンプルしてくればそうなのですが、この場合には 36個もサンプルしています。統計的にばらつくものも、サンプルをたくさんとればだんだんと真値に近づきます。その近づき方は「サンプル数の平方根に反比例」するのです。サンプルをN個とってくると、ばらつき具合は 1/√N に小さくなるのです。サンプルを100個採ってくれば、ばらつき具合は 1/10 になるということです。

ということで、平均 200g、標準偏差 4g の母集団から 36 個のサンプルをとったら、その標準偏差は 4(g) * 1/√36 = 4/6 = 2/3(g) ≒ 0.67 (g) です。
つまり
  200g ± 2.57*0.67 g つまり 200 ± 1.7 g の範囲に 99.0% の確率で入る
ということです。
従って、「36個の平均が198g」のサンプルはこの範囲内に入らず、「1%以下のきわめて確率の低いことが起こっている」「有意である」ことを示します。つまり「機械は正常に作動しているとは言えない」ということになります。

 上の説明で、どこかで「仮説」を立てていますか?
(実は、「平均 200g、標準偏差 4g の母集団から 36 個のサンプルをとったら、200 ± 0.67 g の範囲に、全体の度数の 99.0% が入るはずだ」というのが「仮説」なのです。でも別に「仮説」と言わなくとも説明できていますよね?)

(2)「今までの治療法による治療率は25%」なら、患者103人なら26人が治癒します。これが「35人」になるのは、統計的に起こりうるばらつきの範囲内なのか、何かの理由がないと起こらない(ばらつきの範囲内では説明できない、理由・意味がある=有意である)のかを調べます。
 これは「平均値」の検定ではありませんね。仮に「今までの治療法と同じ治療率25%だとしたら(仮説)、103人中35人が治癒することは統計的に起こりうるか」を調べる、典型的な「仮説検定」ですよ。

これには、「基準となる治療率からどれだけ異なるか」を数値的に表した「カイ二乗値」という数値と、その分布を用います。(基準値に対する「適合度の判定」と呼ばれます)
そのために、こんな表を書きます。

          治癒した人数   治癒しなかった人数    合計
治療方法改善後     35人        68人       103人

今までの治療法と同じ  26人        77人       103人
治療率25%だとしたとき
(基準となる治療率)

これから「カイ二乗値」というものを計算します。「基準」に対する「二乗偏差」を基準値で割ったもの。

 カイ二乗値= (35 - 26)^2 /26 + (68 - 77)^2 /77 ≒ 3.115 + 1.052 = 4.167

これは、「自由度 1 のカイ二乗分布」(自由度は、変数の数が「治癒した人数」「治癒しなかった人数」の「2」なので、これから1を引いた数)に従い、有意水準5% つまり下記の「カイ二乗分布表」で色のついた部分が 0.05 となる値が「3.84」で、これよりも大きいことから「出現確率は 5%以下」、つまり「めったに起こらない」「有意だ」ということです。
http://www.biwako.shiga-u.ac.jp/sensei/mnaka/ut/ …

ということで、最初に仮定した「今までの治療法と同じ治療率25%だとしたら」という「帰無仮説」が棄却されて、「今までの治療法とは治療率が異なる」という「対立仮説」を採択するという結論となります。(どう異なるのか、どんな治療率になるのかは、この検定では何も言えない)

上にあげた「ハンバーガー統計」にも「カイ二乗検定」が出てきますので、併せて読んで理解してください。
    • good
    • 0
この回答へのお礼

すみません、例の問題を書き間違えてしまいました。
(2)の問題です。補足の方に訂正文を載せておきます。

せっかく丁寧に教えていただいたのに、申しわけありませんでした。

お礼日時:2017/12/20 16:15

No.1です。



>訂正後の(1)と(2)は全く同じ考え方で解いて良いのでしょうか。

よいと思いますよ。
どちらも母集団の平均、標準偏差(分散)が分かっていて、そこから一定個数のサンプルを採ったときの平均値が統計的に有意かどうかを調べるものですから。

No.1に書いた(1)のやり方で、訂正後の(2)も処理できます。

>(1)の問題は「仮説検定:仮説検定の手順」という項目で、(2)は「仮説検定:平均値の検定(母分散が既知の場合)という項目で取り上げられています。

(1)(2)は単なるテキストの「章立て」の違いということでしょう? (1)が「手順」で、(2)がそれを「平均値」に適用したということ。

単に「理解不足」「きちんと勉強していない」だけの質問ですよね?
もっときちんと理解してから、本当に分からないことを質問してください。
    • good
    • 0

No.1&2です。

少し追加。

元の質問のある

>その違いは分散が既知であるかどうかであると習ったのですが、文章中の標準偏差を二乗すれば両方とも標準偏差が求まりませんか???

「文章中の標準偏差を二乗すれば両方とも『分散』が求まりませんか」ということかと思いますが、「母集団」の分散のことか、「サンプル(標本)」の分散のことかなど、教科書に書かれていることがどういうことなのかも、きちんと理解してくださいね。
例題(1)(2)のように「母分散が既知で、標本分散が未知」とか、
下記の質問のように「母分散が未知で、標本分散が分かっている」(ふつうはこちらのケースの方が多い)とか、いろいろなケースがありますから。
https://oshiete.goo.ne.jp/qa/10148680.html
    • good
    • 0
この回答へのお礼

ご丁寧にURLまで載せていただき、ありがとうございました。

お礼日時:2017/12/20 21:36

企業でSQCを推進する立場の者です。



回答とは少し違いますが、とても重要なことを書きます。

設問(1)ですが、本当に「機械は正常に作動していると言えるか」と書いてあったのでしょうか。教科書を教えて頂けませんか。

なぜなら、検定は「違う」「違うとは言えない」ということは言えますが、積極的に「同じである」ということは言えないのです。

設問のように積極的に「正常に作動してる」と言うためには、「同等性の検定」という方法が必要になります。これまでに回答されている方法ではダメなのです。

設問が正しいかどうか、一度ご確認ください。
    • good
    • 0
この回答へのお礼

ええ、確かに機械は正常に作動しているといえるかを有意水準1%で検定せよと書いてあります。
教科書は「excelによるメディカル/コメディカル統計入門」という本です。共立出版の緑色の本です。

お礼日時:2017/12/21 10:28

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!