質問

グラフなどに使われているP<0.05などと書かれている場合の
「有意差」の言葉の意味が分かりません・・。

統計上偶然とは思えない可能性がある

と辞書に書いているのは何度も読んだのですが
「有意差がある」というのは
違いがあると理解すればいいんですか???

おばかな私に分かりやすい回答をいただければと思います。

通報する

回答 (10件)

http://oshiete.goo.ne.jp/qa/3705079.html

たとえば,100回勝負して,45勝55敗だったとします.

この時,相手は「オレのほうが強い」と言うでしょう.

その時,あなたが「実力が同じでも,偶然でこのくらいのばらつきは出る」と主張したら,相手は,「その偶然は何パーセントだよ?」と言うかもしれません.

それは,計算可能です.

あなたは,その確率が何%なら,相手のほうが強いと納得できますか.

その偶然が5%未満だったら,実力差ありとしようというのが,通り相場になっています.

この時の5%を有意水準と言い,計算した確率が5%を切っていたら,実力に「有意差あり」ということになります.

今はやりのざっくりした説明でした.

統計では、ある二つのデータに差があるかどうかを調べるとき、直接「差がある」ことを立証するのではなく、

(1)二つのデータに差がない(ただの偶然)と仮定する。
(2)それがある低い確率Pでしか起こらない(=偶然とは思えない)ことを示して、(1)の仮定を否定する。

という方法をとります。「有意差がある」とは、(2)が成り立つ、すなわち「差がないとすると、非常にまれな偶然である」ことをいいます。

このとき、確率Pを有意水準といって、0.05=5%や、0.01=1%がよく使われます。

なぜこのような方法をとるのかというと、(1)の仮定が正しいにもかかわらず、これを否定してしまう確率(ただの偶然を差があると間違える確率)が、有意水準Pと等しくなるためです。逆に、(1)の仮定が間違っているにもかかわらず、これを否定しない確率(差があるのに偶然と間違える確率)は、Pより高くなり、また場合によって変動します。

統計的には、ただの偶然を差があると判断してしまうほうが問題になることが多いので、このような方法をとります。

あまり詳しいことを知っているわけではありませんので申し訳ありませんが、私は次のように理解しています。
検定や推定をするときには、有意水準が決められます。
その有意水準に当てはめて、雑な言い方になりますが、
有意水準内にあれば×、信頼区間内にあれば○ と結論が出されます。

このように有意水準を考えて判断をした結果、違いがあると結論づけられたときに、
有意差があるといい、差がないと結論付けたときには、有意差がない、というのではないでしょうか。

すなわち、有意水準の範囲を考慮して考えると差があるといえる、
あるいは差があるとはいえない、ということなのではないでしょうか。.

「有意水準が5%」なら、「95%の確率で差があるといえる」ということでしょうか。
違っていたらごめんなさい。

逆に、「有意さがない」とは、「違い、差がない」のではなくて、「このデータからでは違い、差があるとは結論できない」という意味です。

実際にはまったく差がないかもしれませんし、たとえば・・赤:白=1億:1億+1という微小な差があるかもしれませんし、赤:白=3:2というかなり大きな差が在るかもしれません。

「有意差がある」というのは、「違いがあって、その違いが偶然で起きたものとは考えにくいから、差があるとして扱ってもよかろう」と考えるのがよろしいのでは。P<0.05というのは、「この違いが偶然で起きたものであるとするなら、そういう偶然が起きる確率Pが0.05より小さい」という意味です。(つまり、結果があくまで偶然に起きたという危険(可能性)が、小なりとはいえ在るわけです。)

具体例をあげましょうか。とある会社が、麦の肥料について新製品を開発し、試験をしているとしましょう。当然、当社従来品と新製品で、収穫量を比較することになります。
帰無仮説(群間に差が無いと言う仮説)とは、この場合、「当社従来品の肥料を与えた場合と、新製品の肥料を与えた場合とで、収穫量に差は無い」という仮説になります。
さて、当社従来品の肥料を与えた場合と、新製品の肥料を与えた場合とで、収穫量を比較したとき、以下の結果になったとします。
小麦、従来品:101,101,97,91,101,91,92,102・・・平均97.0
小麦、新製品:101,92,104,104,96,100,94,95・・・平均98.3

大麦、従来品:104,103,100,101,103,104,101,104・・・平均102.5
大麦、新製品:108,108,108,106,105,108,108,109・・・平均107.5

小麦の場合、「どちらの肥料でも、収穫量に差は無い」場合でも、偶然このような結果になる可能性は多々ありますので、「どちらの肥料でも収穫量に差はあるとはいえない」(つまり、差はあるかもしれないが、同じとして扱ってもよかろう)=「有意差はない」という結論になります。


大麦の場合、「どちらの肥料でも、収穫量に差は無い」場合では、偶然このような結果になる可能性がほとんど無い(P<0.05なら5%以下でしか起き得ない)ので、「肥料間で収穫量に差があるとはいえる」(つまり、明白な差があると思えるので、差があるとして扱ってもよかろう)=「有意差がある」という結論になります。

帰無説(群間に差が無いと言う仮説,統計解析ではこの仮説を立てる)を5%以下で捨てる.ということになります.ここ半世紀,生物から得られる統計学的差は5%で設定されています.つまり20回に1回の間違いは許しましょうと云うことです.もうひとつの考え方は,同じ調査を100回したら同様な結果が95回得られると云うことです.リスクとベネフィットによって有意水準が設定されます.おそらく飛行機の墜落・精密基盤の間違いなどは5%よりきわめて小さいP<0.000001と設定されいてるでしょう.統計の分野によって確率(P)は異なります.有意水準値は何%?という事は以下に示します.
水準のとり方については,5%にするか1%にするかまた0.1%にするか,どう決めるかという問題である.一般的には,前述の0.05, 0.01or0.001とるが,有意水準値を何%に設定するのが望ましいのかは,推計学の問題ではなく,人生観・社会観・自然科学の問題である.たとえ同じ1%水準といっても,それが赤血球数の差が認められるかどうかの場合の危険率と飛行機が墜落する危険率とでは,おのずから異なることが理解できよう.つまり,危険率を何%にするかは,仮説が正しいにも関わらず仮説を捨ててしまうという誤りを犯した時に,こうむる損害の重大さによって決めるべきである.生物統計解析では,有意水準値の境界をここ半世紀のあいだ国際的に5%水準としている.
なぜ生物試験では5%の危険率を採用するのか?
1)統計が育てられた農学の領域では,大学を出て20年くらいは現役で実務に就く.種子を蒔き収穫を調べるという試験では,1年単位である.そこで長い研究生活のうち,1回位の言い過ぎは,人の常として許してよかろう.20回に1回ということで5%の線が認知された.
2)八百長賭博の心理的な研究から,そうはざらにないという基準がおおよそ5%になる.
3)碁でもテニスでもよいが,ほぼ互角と思える相手と何回か勝負し,続けて負けたとする.この時何回続けて負けたら相手の方が強いと認めるだろうか.人の性格にもよるが,3回で認める人は少ないだろう.3回ぐらいなら,互角の相手に続けて負けることが珍しくない.それが4回続けて負けたとなると大抵の人は弱気になるに違いない.更に5回となるとどうであろうか,5回続けて負けたら,互角という帰無仮説を棄却して,相手が強いことを認めるのが常識な判断であろう.相手が互角の時に1回負ける確率は1/2である.5回続けて負ける確率は (1/2)5=0.03, すなわち3%程度である.すなわち,「5回続けて負けたら,相手が強いと認める」という判断基準では,本当は互角なのに相手が強いと判断する確率,第一種の過誤の確率が5%程度はあることになる.
 2回続けて負ける確率は, (1/2)2=25%, 3回続けて負ける確率は, (1/2)3=12.5%,4回続けて負ける確率は, (1/2)4= 6.3%,5回続けて負ける確率は, (1/2)5= 3.2%
となります.
統計解析の結果,P<0.05を優先してはいけません.統計学的にP<0.05の場合でも,調査した人が生物学的に差が無ければ,勇気を持って差が無いと言って下さい.

統計では、ある事柄が偶然発生する確率(有意確率)を求めて
それが偶然起こったのか何らかの必然なのかを結論つけます。
その時の偶然-必然の境目を決めます。その値を有意水準と
言い、それより小さい確率になると有意差がある、有意である
といいます。つまり偶然起こったこととは考えにくい事が
起こってますよと言ってます。

P<0.05とはある事柄が偶然起こる確率が5%未満と言うことです。
(Pはprobabilty=確率の頭文字です)
有意水準を決める時には5%や1%が良く選択されます。

サイコロを5回振って出目が全部1になる確率は0.00013ほどです。
まともなサイコロでも起こりうることですが、どうも怪しい
ですよね。だからまともなサイコロの出目とは有意差があるの
です。偶然起こりうることではなく、イカサマと言う必然が
ありそうですね。

ここで出した確率0.00013はまともなサイコロで1が5連続ででる
確率ですが、同時に『このサイコロはイカサマだ』と決め付けた
時に間違う確率でもあります。そのためこれは危険率とも呼ばれます。
統計では通常5%や1%未満なら間違う確率を断った上で、結論を
つけます。

見た感じで結論を下してはいけないことは沢山あります。
変な例ですが、オリンピックや世界陸上の短距離で決勝に並ぶのは国籍によらずほとんど黒人です。これから、黒人は足が速いと結論できるでしょうか。
ある家族で4人の子供が全員女の子だったとして、この父親からは男子は生まれないと結論して良いでしょうか。
そのとき、確率的にそんな現象が起きるかどうか検証します。有意差というのは、確率的な変動に比べて意味があるほど変動があるか、を調べます。
子供の性別では、生まれる子供の性別の確率は男女1/2と仮定し、4人全員が女性という事象がどれほど起きるか計算します。この場合は確率0.0625ですから、それほど希なことではない(P=0.05というほど希ではない)と結論します。
オリンピックの決勝での黒人選手、これは確率的に起きることかどうかは私にはわかりません。

有意差というのは、違いがある"可能性"があるということです。
あくまで可能性です。断定はできません。

P<0.05は有意水準5%を意味します。有意水準5%とは、5%の"確率"で評価に差があるとは言えない、ということを示します。

確率なので可能性です。

このQ&Aは役に立ちましたか?102 件

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

新しく質問する

注目の記事

おしトピへのコメントで10人に1人に500円分のギフト券プレゼント!(先着2000名様)

話題のトピックにさくっとコメントできる「おしトピ」で指定のオーダー3件にコメントした方先着2000名様の10人に1人にギフト券をプレゼント!
フジテレビ出身のフリーアナウンサー長谷川豊氏の質問にも回答受付中!

このQ&Aを見た人が検索しているワード


新しく質問する

このカテゴリの人気Q&Aランキング

毎日見よう!教えて!gooトゥディ

べんりQ&A特集