グラフなどに使われているP<0.05などと書かれている場合の
「有意差」の言葉の意味が分かりません・・。

統計上偶然とは思えない可能性がある

と辞書に書いているのは何度も読んだのですが
「有意差がある」というのは
違いがあると理解すればいいんですか???

おばかな私に分かりやすい回答をいただければと思います。

このQ&Aに関連する最新のQ&A

A 回答 (10件)

    • good
    • 30

たとえば,100回勝負して,45勝55敗だったとします.



この時,相手は「オレのほうが強い」と言うでしょう.

その時,あなたが「実力が同じでも,偶然でこのくらいのばらつきは出る」と主張したら,相手は,「その偶然は何パーセントだよ?」と言うかもしれません.

それは,計算可能です.

あなたは,その確率が何%なら,相手のほうが強いと納得できますか.

その偶然が5%未満だったら,実力差ありとしようというのが,通り相場になっています.

この時の5%を有意水準と言い,計算した確率が5%を切っていたら,実力に「有意差あり」ということになります.

今はやりのざっくりした説明でした.
    • good
    • 165

統計では、ある二つのデータに差があるかどうかを調べるとき、直接「差がある」ことを立証するのではなく、



(1)二つのデータに差がない(ただの偶然)と仮定する。
(2)それがある低い確率Pでしか起こらない(=偶然とは思えない)ことを示して、(1)の仮定を否定する。

という方法をとります。「有意差がある」とは、(2)が成り立つ、すなわち「差がないとすると、非常にまれな偶然である」ことをいいます。

このとき、確率Pを有意水準といって、0.05=5%や、0.01=1%がよく使われます。

なぜこのような方法をとるのかというと、(1)の仮定が正しいにもかかわらず、これを否定してしまう確率(ただの偶然を差があると間違える確率)が、有意水準Pと等しくなるためです。逆に、(1)の仮定が間違っているにもかかわらず、これを否定しない確率(差があるのに偶然と間違える確率)は、Pより高くなり、また場合によって変動します。

統計的には、ただの偶然を差があると判断してしまうほうが問題になることが多いので、このような方法をとります。
    • good
    • 57

あまり詳しいことを知っているわけではありませんので申し訳ありませんが、私は次のように理解しています。


検定や推定をするときには、有意水準が決められます。
その有意水準に当てはめて、雑な言い方になりますが、
有意水準内にあれば×、信頼区間内にあれば○ と結論が出されます。

このように有意水準を考えて判断をした結果、違いがあると結論づけられたときに、
有意差があるといい、差がないと結論付けたときには、有意差がない、というのではないでしょうか。

すなわち、有意水準の範囲を考慮して考えると差があるといえる、
あるいは差があるとはいえない、ということなのではないでしょうか。.

「有意水準が5%」なら、「95%の確率で差があるといえる」ということでしょうか。
違っていたらごめんなさい。
    • good
    • 25

逆に、「有意さがない」とは、「違い、差がない」のではなくて、「このデータからでは違い、差があるとは結論できない」という意味です。



実際にはまったく差がないかもしれませんし、たとえば・・赤:白=1億:1億+1という微小な差があるかもしれませんし、赤:白=3:2というかなり大きな差が在るかもしれません。
    • good
    • 27

「有意差がある」というのは、「違いがあって、その違いが偶然で起きたものとは考えにくいから、差があるとして扱ってもよかろう」と考えるのがよろしいのでは。

P<0.05というのは、「この違いが偶然で起きたものであるとするなら、そういう偶然が起きる確率Pが0.05より小さい」という意味です。(つまり、結果があくまで偶然に起きたという危険(可能性)が、小なりとはいえ在るわけです。)

具体例をあげましょうか。とある会社が、麦の肥料について新製品を開発し、試験をしているとしましょう。当然、当社従来品と新製品で、収穫量を比較することになります。
帰無仮説(群間に差が無いと言う仮説)とは、この場合、「当社従来品の肥料を与えた場合と、新製品の肥料を与えた場合とで、収穫量に差は無い」という仮説になります。
さて、当社従来品の肥料を与えた場合と、新製品の肥料を与えた場合とで、収穫量を比較したとき、以下の結果になったとします。
小麦、従来品:101,101,97,91,101,91,92,102・・・平均97.0
小麦、新製品:101,92,104,104,96,100,94,95・・・平均98.3

大麦、従来品:104,103,100,101,103,104,101,104・・・平均102.5
大麦、新製品:108,108,108,106,105,108,108,109・・・平均107.5

小麦の場合、「どちらの肥料でも、収穫量に差は無い」場合でも、偶然このような結果になる可能性は多々ありますので、「どちらの肥料でも収穫量に差はあるとはいえない」(つまり、差はあるかもしれないが、同じとして扱ってもよかろう)=「有意差はない」という結論になります。


大麦の場合、「どちらの肥料でも、収穫量に差は無い」場合では、偶然このような結果になる可能性がほとんど無い(P<0.05なら5%以下でしか起き得ない)ので、「肥料間で収穫量に差があるとはいえる」(つまり、明白な差があると思えるので、差があるとして扱ってもよかろう)=「有意差がある」という結論になります。
    • good
    • 33

帰無説(群間に差が無いと言う仮説,統計解析ではこの仮説を立てる)を5%以下で捨てる.ということになります.ここ半世紀,生物から得られる統計学的差は5%で設定されています.つまり20回に1回の間違いは許しましょうと云うことです.もうひとつの考え方は,同じ調査を100回したら同様な結果が95回得られると云うことです.リスクとベネフィットによって有意水準が設定されます.おそらく飛行機の墜落・精密基盤の間違いなどは5%よりきわめて小さいP<0.000001と設定されいてるでしょう.統計の分野によって確率(P)は異なります.有意水準値は何%?という事は以下に示します.


水準のとり方については,5%にするか1%にするかまた0.1%にするか,どう決めるかという問題である.一般的には,前述の0.05, 0.01or0.001とるが,有意水準値を何%に設定するのが望ましいのかは,推計学の問題ではなく,人生観・社会観・自然科学の問題である.たとえ同じ1%水準といっても,それが赤血球数の差が認められるかどうかの場合の危険率と飛行機が墜落する危険率とでは,おのずから異なることが理解できよう.つまり,危険率を何%にするかは,仮説が正しいにも関わらず仮説を捨ててしまうという誤りを犯した時に,こうむる損害の重大さによって決めるべきである.生物統計解析では,有意水準値の境界をここ半世紀のあいだ国際的に5%水準としている.
なぜ生物試験では5%の危険率を採用するのか?
1)統計が育てられた農学の領域では,大学を出て20年くらいは現役で実務に就く.種子を蒔き収穫を調べるという試験では,1年単位である.そこで長い研究生活のうち,1回位の言い過ぎは,人の常として許してよかろう.20回に1回ということで5%の線が認知された.
2)八百長賭博の心理的な研究から,そうはざらにないという基準がおおよそ5%になる.
3)碁でもテニスでもよいが,ほぼ互角と思える相手と何回か勝負し,続けて負けたとする.この時何回続けて負けたら相手の方が強いと認めるだろうか.人の性格にもよるが,3回で認める人は少ないだろう.3回ぐらいなら,互角の相手に続けて負けることが珍しくない.それが4回続けて負けたとなると大抵の人は弱気になるに違いない.更に5回となるとどうであろうか,5回続けて負けたら,互角という帰無仮説を棄却して,相手が強いことを認めるのが常識な判断であろう.相手が互角の時に1回負ける確率は1/2である.5回続けて負ける確率は (1/2)5=0.03, すなわち3%程度である.すなわち,「5回続けて負けたら,相手が強いと認める」という判断基準では,本当は互角なのに相手が強いと判断する確率,第一種の過誤の確率が5%程度はあることになる.
 2回続けて負ける確率は, (1/2)2=25%, 3回続けて負ける確率は, (1/2)3=12.5%,4回続けて負ける確率は, (1/2)4= 6.3%,5回続けて負ける確率は, (1/2)5= 3.2%
となります.
統計解析の結果,P<0.05を優先してはいけません.統計学的にP<0.05の場合でも,調査した人が生物学的に差が無ければ,勇気を持って差が無いと言って下さい.
    • good
    • 12

統計では、ある事柄が偶然発生する確率(有意確率)を求めて


それが偶然起こったのか何らかの必然なのかを結論つけます。
その時の偶然-必然の境目を決めます。その値を有意水準と
言い、それより小さい確率になると有意差がある、有意である
といいます。つまり偶然起こったこととは考えにくい事が
起こってますよと言ってます。

P<0.05とはある事柄が偶然起こる確率が5%未満と言うことです。
(Pはprobabilty=確率の頭文字です)
有意水準を決める時には5%や1%が良く選択されます。

サイコロを5回振って出目が全部1になる確率は0.00013ほどです。
まともなサイコロでも起こりうることですが、どうも怪しい
ですよね。だからまともなサイコロの出目とは有意差があるの
です。偶然起こりうることではなく、イカサマと言う必然が
ありそうですね。

ここで出した確率0.00013はまともなサイコロで1が5連続ででる
確率ですが、同時に『このサイコロはイカサマだ』と決め付けた
時に間違う確率でもあります。そのためこれは危険率とも呼ばれます。
統計では通常5%や1%未満なら間違う確率を断った上で、結論を
つけます。
    • good
    • 10

見た感じで結論を下してはいけないことは沢山あります。


変な例ですが、オリンピックや世界陸上の短距離で決勝に並ぶのは国籍によらずほとんど黒人です。これから、黒人は足が速いと結論できるでしょうか。
ある家族で4人の子供が全員女の子だったとして、この父親からは男子は生まれないと結論して良いでしょうか。
そのとき、確率的にそんな現象が起きるかどうか検証します。有意差というのは、確率的な変動に比べて意味があるほど変動があるか、を調べます。
子供の性別では、生まれる子供の性別の確率は男女1/2と仮定し、4人全員が女性という事象がどれほど起きるか計算します。この場合は確率0.0625ですから、それほど希なことではない(P=0.05というほど希ではない)と結論します。
オリンピックの決勝での黒人選手、これは確率的に起きることかどうかは私にはわかりません。
    • good
    • 5

有意差というのは、違いがある"可能性"があるということです。


あくまで可能性です。断定はできません。

P<0.05は有意水準5%を意味します。有意水準5%とは、5%の"確率"で評価に差があるとは言えない、ということを示します。

確率なので可能性です。
    • good
    • 6

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q有意差の求め方?

4台ある分割機で分割した生地の重量を10回ずつ量りました。この4台それぞれで量った重量には有意差があるのか、を知りたい場合、まず何をどのようにしたらいいのでしょうか?

Aベストアンサー

2台であれば、平均値と標準偏差から、t検定が定番。
有意差が見られなければ、F検定。U検定も。
それで有意差が見られず、どうしても見たいのであれば、測定回数を無限大に増やす。

>重量には有意差があるのか
 検定は、有意差を示すのが目的です。言い換えると、無いことは主張できません。統計学の本には書いてありませんが、上記のように無限大の回数測定すれば、必ず差はでますので。

4台になると、多重比較、という手法になります。2群(2台)ならt検定ですが、これ以上の数だと、H検定、と教科書には書いてあります。
 多重比較は、全体で有意差がある、ことしか言えません。すなわち、どの機会が正常に動いていない、なんぞは言えません。多重比較は、大流行していますが、私は、価値をほとんど認めていません。

 目的は、正常でない機器を見分けることではないのですか。そうすると、工夫する必要があります。

QP<0.05 有意差について

P<0.05とよくありますが、
AがあればBがある のようなことを証明するのに
AがあればBがない 仮説をたて 否定する ということ、つまりAがあればBがない確率が0.05以下である。ということでしょうか?

医学系の論文ではA疾患にはB症状があるという検討に対して
A疾患にはB症状がない P<0.05 ってありますがどこから0.05という数字を出し、A疾患にはB症状がない Pは0.05未満ということが計算されているわけでなくいきなりでていることに非常に疑問を感じています。

Aベストアンサー

> AがあればBがある のようなことを証明するのに
> AがあればBがない 仮説をたて 否定する

 違います。

> Pは0.05未満ということが計算されているわけでなくいきなりでている

 とんでもない。全然違います。

 場合によりますが、典型的には「AとBは無関係だ」という仮説を立てます。これを帰無仮説という。そして、データを実測する。
 実測したデータの統計量(たとえば平均とか分散とか相関係数とか)が、「AとBは無関係であるにもかかわらず、偶然のばらつきのせいで【たまたま】その値になるかも知れない」と考えた時に、そういう【たまたま】がどのぐらいの確率で起こるかを、確率論に基づいて計算する。その計算の結果として具体的に得られた数値、それがpです。

  0.05という基準は、「pが0.05(5%)未満の確率でしか生じないということは、それは【たまたま】生じたとは考えない」という(論文の著者が)人為的に選んだ基準です。この基準値は、言い換えれば「『【たまたま】生じたとは考えない』という判断が間違いである確率が5%ある」ということ。(0.1で済ませることもあるし、0.01にすることもある。物理理論の検証では0.000001を使うこともあります。)
 なお、pがこの基準以上の値になったときには、「AとBは無関係だ」という仮説は否定できなかった。だから、「AとBの関係は、このデータからは分からなかった」が結論になります。(「AとBは無関係だ」という結論が得られることは、絶対にありません。)

> 非常に疑問を感じています

 最低限、その疑問が完全に解消できるまで、最優先で統計学の勉強をやってください。論文を読むのはそれからです。
 あらゆる科学論文を読むのに必須の、最も基礎的な学力が欠けたままでは、トンデモない誤読・誤解ばかりを積み重ねることになる。学生さんなら自分が落第するだけのことですが、もし仕事上の必要があって論文をお読みであるなら恥をかくだけでは済まない。その誤読のせいで被害を被る人が出かねません。相当ヤバい状況です。

> AがあればBがある のようなことを証明するのに
> AがあればBがない 仮説をたて 否定する

 違います。

> Pは0.05未満ということが計算されているわけでなくいきなりでている

 とんでもない。全然違います。

 場合によりますが、典型的には「AとBは無関係だ」という仮説を立てます。これを帰無仮説という。そして、データを実測する。
 実測したデータの統計量(たとえば平均とか分散とか相関係数とか)が、「AとBは無関係であるにもかかわらず、偶然のばらつきのせいで【たまたま】その値になるかも知...続きを読む

Qアンケート結果の有意差の求め方について

ある事業の事前・事後で,30人程度に30ぐらいの質問をし,6段階(とてもよくあてはまる~まったくあてはまらない)で回答を得る予定です。そのときの得点差(平均)に有意差があるかどうかを知りたいのですが,どのような分析法があるのでしょうか?

Aベストアンサー

事前・事後データは差をとって、その差の値についてt検定(独立1標本の平均値の検定)を行えばよいのです。いわゆる「対応のあるt検定」というのが、このことです。

Q五段階評価での有意差の求め方とグラフの偏差

こんばんわ

たとえばですが、50人に使用前と使用後の感想を
5段階(5、とても思う、4思う・・1全く思わない)評価という
アンケートの集計をやるとします。

この場合有意差を求めるとき、エクセルで
「t検定:一対の標本による平均の検定」を使用すると思うのですが、
結果がすべての項目において有意確率が低すぎ(0.00007とか・・)て
この方法であっているか不安です。

入力する数値が決まっている五段階評価で、
有意差を求めるときは、このデータ分析で合っていますでしょうか。

また、この集計の結果の平均値をグラフにするとき、
誤差?(添付参照)を入れたいのですが、五段階評価だと、
5と答える人もいれば、1と答える人もいます。この場合、
Y誤差範囲を自分で指定して入れることになると思いますが、
この数値はどうやって求めればよいでしょうか?

よろしくお願いいたしますm(_ _)m

Aベストアンサー

マイクロソフトのプログラムで悩むのは無意味です。
いろいろと変な前提条件をつけています。

設問の仕方について、余程気をつけることが必要です。
自分で良く考える事が大切でしょう。

Q統計の有意差について教えて下さい。

仮説検定で、P値を求めて有意差云々を、95%信頼区間で見る場合、「0」を跨ぐと有意差無しと言っている参考書や、「1」を跨ぐと有意差無しと言う人が有り、どちらが正しいのか、よく判りません。教えて下さい。

Aベストアンサー

> たとえば相対危険度=1で、比較したグループ間の確立が同じ、という場合などですね?

そうです。
二つのグループのうち一方が他方より(対象としている)リスクが2倍であるかどうかを検定したい場合は、
帰無仮説:相対危険度=2
対立仮説:相対危険度≠2
として検定を行いますので、標本から計算された相対危険度の信頼区間が2を含んでいれば有意でないとなります。
このように帰無仮説が何であるかが重要です。

QExcelで有意差検定をするには?

実験結果を検討していて、有意差検定をしてみては?といわれました。
有意差検定というもの自体なんとなくしかわからないのですが、
ヘルプで、有意差検定をしらべたところ、F検定というのが出てきました。
有意差検定とF検定は同じですか?
有意差検定のやり方を知っている方、いらしゃいましたらお返事よろしくお願いします。

Aベストアンサー

有意差検定とは、F検定、T検定といった色々ある検定方法の総称だと思います。

対象となるデータのどういった事象をの有意差を検定したいかどうかで、F検定をつかうのか、T検定を使うのか決まりますので、F検定が目的に合ったものかどうか
はわかりません。

統計学で言う検定とは、対象となるデータがどのくらいの確立でそういった数値
になったか?を調べるもので、その確率分布がtとかFとかによって違ってきます。
普通有意差があるとは、確率的に0.05%、ないし0.03%より小さい確率になった場合
有意差があるサンプルデータという事になります

片側、両側とは、仮にテストで0点から100点を取った人が綺麗に正規分布すると
すると、いい点数を取る確立しかサンプルデータを採用しないのが片側、
いい点を取る確立も悪い点を取る確立もとに採用するのが両側です。

Excel統計の使い方は、WEBを検索するとたくさん出てくるので探してみて下さい。

Qt検定 (P<0.05、t=2.39)について

露骨な質問で申し訳ありませんが、お解かりになり方がおられましたらお教え願います。
連続で作っている物の重さを量る場合、重さのブレを出す際に、基準の重さをベースに、基準差の平均を出し、偏差を求めると思いますが、管理基準を作成するとなると、標準偏差(SD)および標準誤差(SE)を求め、最終的には、計量法ないしは自主基準で定めた重さ(S)に、基準差の平均(X)を足し、標準誤差(SE)で割り込み数値(Q)を出しております。
過去の資料を見ると、Qの数値が(P<0.05、t=2.39)の2.39より大きいか等しい場合には合格としているのですが、t=2.39の数値の意味が分かりません。
大まかには、理解しそうな感じですが、後輩に教えることが出来ませんので、詳しく説明することが出来る方がおられましたら、よろしくお願い致します。

Aベストアンサー

> Qの数値が(P<0.05、t=2.39)の2.39より大きいか等しい場合には合格としているのですが、

t = 2.39というのはt統計量あるいはt値と呼ばれるものです。現在はコンピュータが使えるのでt統計量ではなくてp値で判断するのが常套です(むしろp値を載せなければいけない)。

また、t = 2.39より大きいか等しい場合ということに限りません。自由度によって判断の基準は変わります(つまりどれ程のデータ数があるのか)。

一度、[平均値の差の検定]とか[t検定]というキーワードでgoogleして確認した方が良いと思います。

Q統計的に有意差が無いならそれは誤差でしかないですか

ある2群をt検定したところ、2群に有意差はなく、同じような値であると判断されました
私としては「2群に有意差があり片方の群の方が値が小さい」という結果が欲しかったです。
実際片方の群の方が若干値が小さかったので、有意差が出てくれれば良かったのですが出ませんでした。
そこで質問なのですが、有意差が出なければこの2群の差は誤差でしかないのでしょうか?
どうしてもこの2群に差があるという話で論文を書きたいのですが、やはり有意差が無ければダメでしょうか?
実験の精度を上げればもっと値に差が出るかもしれませんがこれ以上上げることが出来ません

Aベストアンサー

 t検定で有意差が出なかった。有意差が出なかったからと言って「それは誤差でしかない」という結論にはなりません。単に、帰無仮説「両群は同じ」を棄却できず、従って「これだけじゃ何も言えない」というのが検定の結果です。だから、これで堂々と論文書けばいいんです。

 ただし考察として、
(1) フツーに考えれば両群にもっとはっきり違いが出そうなものなのに、驚いた事にこれだけしっかり実験したのに違いが検出できなかった。これだって重要な結論です。(有名な、マイケルソン・モーレーの光速の測定実験はまさにこれです。)となると、
(1a) 実験のやり方・測定方法に何か問題があったんじゃないだろうか。この点をしっかり議論して、もしアナが見つからないのであれば、
(1b)実験はきっちりできていたのに、予想された違いが検出できなかった。ということは、「フツーの考え」(従来信じられている理論)やその適用条件にどこか誤り・見落としがあるのかもしれない。どんな誤りがありそうか。また、それを検証するには今後どんな実験をやればいいか、という議論ができます。大発見に繋がる可能性があるんです。

(2) もっとノイズを少なくする方法はないか、あるいは、もっと事の本質を旨く測る方法はないか、という議論もできます。もちろん、単に「もっとサンプル数を増やせば差が検出できそうだ」ということも考えられます。(今回の結果で得られたp値から、「差が検出できるためには、どのくらいのサンプル数が必要か」を見積もることができるでしょう。)この方向は、(1)に比べて旧守的でセコい話ではありますが。

 ところで、「差が検出できるまで実験を続ける」ということをやったとすると、どうでしょうか。両群に本当に差がない場合でも、ノイズのゆらぎのせいで、実験はいつか必ず終わるんです。そして、実験が終わった時には必ず「(わずかながら)差が検出できた」という結論になる。というわけで、結論は最初から決まっている。ならば、実験をやる意味なんかそもそもなかったことになる。これは「検定」という方法論が持つ弱点のひとつなんです。
 このドツボに嵌らないためには、「両群の差について、理論的な予測値と実験結果とを比較して、その理論が成立っていると言えるかどうかを検証する」という観点が不可欠なんです。

 t検定で有意差が出なかった。有意差が出なかったからと言って「それは誤差でしかない」という結論にはなりません。単に、帰無仮説「両群は同じ」を棄却できず、従って「これだけじゃ何も言えない」というのが検定の結果です。だから、これで堂々と論文書けばいいんです。

 ただし考察として、
(1) フツーに考えれば両群にもっとはっきり違いが出そうなものなのに、驚いた事にこれだけしっかり実験したのに違いが検出できなかった。これだって重要な結論です。(有名な、マイケルソン・モーレーの光速の測定実...続きを読む

Q任意の正の整数Mに対して、M<g_p<p-1となる無限に多くの素数pが存在する

次の結果は初等的に証明することができるとかいてあったのですが、つまずいています。
g_pは法pでの最小の原始根( 1<g_p<p )のことです。
すべての素数について原始根g(1≦g≦p-1)が存在するのは理解できたのですが、最小といいますか最小の原始根は1だろうと思いますが、1でない次の原始根がMとp-Mの間に入るのは、帰納法ですと、まずM=2についてg_pが間に入る素数は原始根の表から一つは見つかりますが、無限に多くの素数があるかどうかで詰まっています。

Aベストアンサー

まず注意
「最小といいますか最小の原始根は1だろうと思いますが」
とありますが、全く違います。

自然数aが素数pの原始根となるとは
p-1乗して初めてa^(p-1)≡1 (mod p)となることをいいます。
(よって、a,a^2,…a^(p-2)はmod pで1と合同ではありません)

したがって、1^1≡1 (mod p)となるから
1はpの原始根にはなりえません。


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング

おすすめ情報