【先着1,000名様!】1,000円分をプレゼント!

統計の初心者です。
統計学の復習をしていて、帰無仮説が棄却されるときの理由についてわからなくなりました。

配布されたプリントには、こんなふうに書かれています。

●帰無仮説:統計的な推論の出発点になる。最終的には破棄したい仮説。
 多くは、「有意水準」(=そうなる確率)5%で、それ以上なら採択、それ以下なら棄却する。
  =帰無仮説が正しい場合、全く偶然にそれくらい標本統計量が大きい値になってしまう確率

 ・臨界値を超えていない→帰無仮説を採択。
 ・臨界値を超えている→帰無仮説を棄却、対立仮説を採択する。

また、検定について、ネット上では

●無帰仮説が正しいなら滅多に起こらない事象(=この前提が覆るような珍しいケース)が
 発生する確率を計算で求める。
 この「めったに起こらない・起こる」の境界値を「有意水準」と呼び、これを超えた場合は、
 前提とした仮説は間違っていたと解釈。(統計では「棄却」と呼ぶ。)

とあります。

帰無仮説が正しいとした場合、「それが滅多に起こらない」(p<0.05など)というのは、
どちらかというと、帰無仮説を棄却することに繋がりそうに思えるのですが、
この状態で帰無仮説が正しいと言える理由がわかりません。
ですので、「これを超えた場合に帰無仮説が棄却される」という論理もわかりません。

このことについて詳しく教えてくださいませんでしょうか。
よろしくお願いいたします。

質問者からの補足コメント

  • つらい・・・

    カイ2乗検定に関するつぎの手順の内容は理解できます。

    ・帰無仮説として「AとBには差がない」とした。
    ・有意水準を5%に設定した場合、カイ2乗値がたとえば4.35であったら、これは「めったに起こらないこと」であると言える。
    ・「めったに起こらないこと」が起こってしまったのは、帰無仮説が間違っていたからだと考え得る。
    ・ゆえに、帰無仮説「AとBには差がない」は間違っていたと考えられ、棄却され、対立仮説「AとBには差がある」が採択される。(=結論)

    つまり、ここでは、有意水準よりも小さい場合、「滅多に起こらない」→「帰無仮説がおかしい」という論理です。

    けれども、先の、有意水準より低い場合に帰無仮説が採択される、というのは、上記のものと正反対になっているので、これが理解できずに困っております。
    ご助言、よろしくお願いいたします。

      補足日時:2015/07/21 00:51

このQ&Aに関連する最新のQ&A

A 回答 (4件)

ANo.1の追加説明です。


 ご覧のプリントに限らず、デタラメな説明がろくに考えもせずに垂れ流されているでしょうかね。嘆かわしいことです。

 「帰無仮説」は、棄却されれば否定され、棄却されなければ何も言えない。だからいずれにせよ「成り立つ」ということは決してない。そういう悲しい運命にふさわしいネーミングです(笑。「証明したいことが無に帰す」なんてコジツケじゃありません(晋ちゃんの答弁じゃあるまいし)。

 「帰無仮説を棄却するという判断が誤りである確率p」は帰無仮説から導く。もっぱらそのためにこそ、帰無仮説というものが使われます。どういうことかと言うとですね:
 ANo.1のコインの話なら、「表が50%・裏が50%だ」と表明している帰無仮説は、もっと厳密に言いますと「毎回のコイントスは独立である(過去に出た結果とは無関係である)。そして、毎回のコイントスで表・裏が出る確率は一定のままである」ということも含意しているんです。
 で、これらの仮定から、確率論によって「表・裏がでる頻度は二項分布に従う」ということが帰結できる。なので、たとえば「10回トスしたら表が1回、裏が9回出た」という実験結果があれば、「二項分布に従い表が出る確率が50%である実験において、『10回中表が1回だけ出ないか、それ以上に珍しいこと』が偶然生じる確率pが幾らであるか」が確率論で計算できる。
 そういう仕掛けです。ですからもちろん(帰無仮説が「実験結果は正規分布に従う」ということを含意していないのなら)有意水準と正規分布とは無関係です。

 なお、「確率統計」だなんていい加減な表現がしばしば使われますけれども、両者は全くの別物です。
 確率論は「仮定が(完璧に)成り立つ場合に、どんな確率が生じるか」を計算する、揺るぎない数学です。もちろん、その仮定が現実に成り立ってるのかどうか、という心配については一切扱わない。
 一方、統計は実験や過去の経験に基づき、それに確率論を応用することによって、現実がどうなってるかについて推測を行うものであって、これは数学ではない。
    • good
    • 0
この回答へのお礼

再び詳しく教えて下さってありがとうございました。

・・・今、扇風機をつけながら統計を勉強しているところです。
夜中のほうが集中できますが、考えているとすぐに時間が経ちます。
理解するには面白いのですが、片っ端から言葉を教えながらでないと
先に進めませんので、一気に勉強する方がわかり安いですね。
ただ、わからないことにぶつかると、時間が滝のように流れていきます・・・

ご丁寧にご説明くださり、ほんとうにどうもありがとうございました。
助かりました。
もうしばらく頑張ります!(^-^)

お礼日時:2015/07/22 02:48

一般に、統計で何かを議論するときには、何らかの「仮説」と「実際に観察された結果(得られたデータ)」との差が、単なる偶然の誤差ではない、明らかな相違があることを、「統計的に有意である」といいます。

「違いには意味がある」ということです。
 逆に言えば、「偶然の一致」とか「誤差の範囲内」ということであれば、「統計的に有意ではない」(違いに論理的な理由がない)ということです。

 仮説としては、「証明したいこと」を否定する仮説を立てるのが普通です(帰無仮説=それが正しかったら、証明したいことが無に帰す、という意味なのでしょう)。

 この2つを合わせて、「帰無仮説」と「実際に観察された結果(得られたデータ)」との差が、単なる偶然の誤差か、それとも、それでは済まされない、つまり明らかに相違する理由がある、相違には意味がある、ということを見分けることが、統計を使った作業となります。
 通常であれば、結果的に「帰無仮説」が誤りであることを示し、最初に「証明したかったこと」が正しいことを証明する、ということです。


 「単なる偶然の誤差ではない」ことを示すための判断基準として、あらかじめ「有意水準」を定めます(この範囲を外れたら「有意」=「単なる誤差範囲ではない」とみなす基準、通常5%など)。

 この「有意水準5%」は、下記のような「正規分布」を仮定しています。正規分布では、「平均値を中心として、標準偏差の±2倍」の範囲内に約95%が入り、その外側になる確率は5%程度です。「標準偏差の±3倍」だと、範囲内に99.7%が、範囲外が0.3%になります。
 通常、「標準偏差程度の違い」は32%程度起こり得ますが、「標準偏差の2倍、3倍」となるとなかなか起こりにくくなるということです。「有意水準5%」ということは、「標準偏差の2倍」以上離れていたら、「偶然では起こり得ない、珍しいこと」「明らかに違いがある」「違いが生じる理由がある」とみなす、ということです。
(統計では、この左右対称の正規分布全体(両側)ではなく、左半分だけ(片側)を使うことが多い)

http://www.stat.go.jp/koukou/howto/process/p4_3_ …
http://www.geisya.or.jp/~mwm48961/statistics/std …


 何故「帰無仮説」などというまどろっこしいものを使うかと言えば、似たようなものがたくさんある中で、「同じであることを示す」というのは実は難しくて、「違いを探せ」という方が簡単なのです。ですから、「帰無仮説」というものを持ち出して、「誤差範囲を超えて違う」ことを示すのです。


 プリント自体は、特に間違ったことを書いているわけではありませんが、上に書いたような「本来の意味」を理解していないと、「書かれていることの意味が分からない」「何故そうする必要があるのか納得しにくい」と思います。
 ネット上の「検定」の説明も、イマイチですね。
 変な表現のしかたで悩むより、きちんとした統計の教科書を買って勉強するほうが、「正しく深い理解」が得られると思います。
    • good
    • 1
この回答へのお礼

ご回答、どうもありがとうございます。
本も何冊か当たりましたが、知りたいことは書かれていませんでいた。
教えてくださってありがとうございました。

お礼日時:2015/07/21 23:02

日常生活では


「ダムの水位が基準を越えたので断水します」
みたいに、小さい方へ「越える」という言葉を使います。

p≧0.05 : 基準に達していない→棄却できない
p<0.05 : 基準を(小さい方へ)越した→棄却

と解釈することができます。


ただ。
・数学用語として、「AがBを越える」とは「A>B」の意味で使われている
・「棄却できない」と「採択する」は同値ではない
という点で問題のある表記だと言えます。
    • good
    • 0
この回答へのお礼

ご回答、どうもありがとうございました。
前提となる基準が異なる人とのあいだで
その人の表現を理解するのは難しいですね。

お礼日時:2015/07/21 23:00

ご覧のプリントには「帰無仮説を採択」とか書いてあるんですか?


 だとすれば、全くの間違いです。そんなスカタンなプリントを書く奴には、人に教える資格がありません。

> それ以上なら採択

 違います。そのときには、帰無仮説は(その名の通り)無に帰す。すなわち、何も言えず、「これだけのデータでは結論は出せなかった」と述べるのが関の山なんです。
 帰無仮説に意味があるのは棄却されたときだけであり、棄却されることによって「帰無仮説の否定」が結論できるんです。

> 「それが滅多に起こらない」(p<0.05など)

 帰無仮説を棄却するという判断が誤りである確率(本当は何も言えないのに、偶然のせいで統計量がたまたま偏っていたために、「帰無仮説が棄却できる」と結論してしまうという誤りが生じる確率)がpです。
 pは帰無仮説が正しいと仮定することによって計算します。だから、pは「帰無仮説が正しいのに、帰無仮説を棄却するという誤った判断をする確率」に他なりません。
 
 「帰無仮説を棄却できない」ということと「帰無仮説を採択する」ということとは全く別の話です。
 たとえば、
H1「このコインを投げると、表が出る確率が50%、裏が出る確率が50%である」
という帰無仮説を立てて20回投げてみたら、10回が表、10回が裏であって、帰無仮説H1が棄却できなかったとしましょう。
 さて、同じ実験で、
H2「このコインを投げると、表が出る確率が51%、裏が出る確率が49%だ」
という帰無仮説もまた棄却できない。
 棄却できない帰無仮説を採択するのだとすると、
H1かつH2「このコインを投げると、表が出る確率が50%であり、表が出る確率が51%であり、裏が出る確率が50%であり、裏が出る確率が49%である」
という、ヘンテコリンな結論が得られることになります。
 どこがおかしいかというと、「棄却できない帰無仮説を採択する」というところ。棄却できない帰無仮説は単に無に帰すのであり、H1もH2も結論できません。
    • good
    • 2
この回答へのお礼

ご回答、どうもありがとうございました。
プリントには、やはりこのように書かれていたのですが、
ご説明くださってよくわかりました。
どうもありがとうございました。

お礼日時:2015/07/21 22:55

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Q帰無仮説 統計 p値

コインを5回続けて投げて5回とも表がでるとする。
このコインは偏っているといえるか?

通常偏っていると考えて 偏っていない という帰無仮説をたてて、0,5の5乗で約3パーセント
P<0.05となっているため仮説は棄却
コインは偏っている。

r=0.90 (P<0.001)
相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下
のようにp値を理解しています。
コインと同様にAとBは相関がないという帰無仮説をたて、計算し偶然r=0.90 になるのは P<0.001という結論を出し、
これだけ確率が低いのだからAとBは相関がないを棄却し、相関係数は0.90は偶然ではない ということでしょうか?

偏っていないのに偶然5回とも表になる確率は5パーセント以下(3パーセント)だから偏っていない という帰無仮説を棄却し
コインは偏っているという結論ですが、P<0.05という決まりがありこれ以下なら帰無仮説は棄却できるということですか?
通常偏っていなと考えて 偏っている という帰無仮説をたててしまったらどうなるのでしょうか?

コインを5回続けて投げて5回とも表がでるとする。
このコインは偏っているといえるか?

通常偏っていると考えて 偏っていない という帰無仮説をたてて、0,5の5乗で約3パーセント
P<0.05となっているため仮説は棄却
コインは偏っている。

r=0.90 (P<0.001)
相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下
のようにp値を理解しています。
コインと同様にAとBは相関がないという帰無仮説をたて、計算し偶然r=0.90 になるのは P<0.001という結論を出し、
これだけ確率が低いのだからA...続きを読む

Aベストアンサー

 検定ってのは、こういうことです:

(1) 帰無仮説を立てる。(このとき、「通常どう考えるか」なんてことはまるで関係ありません。)
(2) 帰無仮説に基づいて確率論を使い、何らかの統計量に関する定量的な予言を導く。
(3) 実測値を使ってその統計量を計算する。さらに、その結果と予言とのずれが偶然に生じる確率pを計算する。
(4) もしその確率pが小さければ、帰無仮説を棄却し、すなわち帰無仮説の否定(これを「対立仮説」という用語で呼ぶという、変な習慣がありますが)を結論とする。また、もしその確率pが大きければ、帰無仮説は無に帰し、すなわち何も言えない。

 なので、帰無仮説ってものは、
(A) それに基づいて「何らかの統計量に関する定量的な予言を確率論で導く」ことができ、さらに、
(B) 実測値から算出した「結果と予言とのずれが偶然に生じる確率pを計算」できるものであること、
という条件が付きます。
 この条件を満たさない仮説は、帰無仮説として使い物になりません。だから、

> 偏っている という帰無仮説をたててしまったら

「偏っている」というだけでは定量的な予言が何も導けず、当然、(2)から先に進めない。なのでそれは帰無仮説にはならないんです。

 別の見方をしてみましょう。
 そもそも、高々有限回しか行えない実測に基づいて、「このコインには偏りがない」つまり、「表が出る確率は正確に0.5である。0.5以外のどんな数値でもない。もちろん0.500000001でもないし、0.49999999でもない」ということが証明できると思いますか? そんな筈ない。だから、「偏っている」という仮説を立てたって、そんなもんどうしようもないんです。

 検定ってのは、こういうことです:

(1) 帰無仮説を立てる。(このとき、「通常どう考えるか」なんてことはまるで関係ありません。)
(2) 帰無仮説に基づいて確率論を使い、何らかの統計量に関する定量的な予言を導く。
(3) 実測値を使ってその統計量を計算する。さらに、その結果と予言とのずれが偶然に生じる確率pを計算する。
(4) もしその確率pが小さければ、帰無仮説を棄却し、すなわち帰無仮説の否定(これを「対立仮説」という用語で呼ぶという、変な習慣がありますが)を結論とする。また、もしその確率...続きを読む


人気Q&Aランキング