二つの要因に強い相関が見られる場合の分散分析についての質問です。
例え話で話しますので、お願いします。

目的:「星野監督ファン度」と「阪神ファン度」が阪神グッズ購入に与える影響を調べる
従属変数:ここ1年間で阪神グッズにかけたお金の合計(千円単位)
要因1:「星野監督ファン度尺度」(5件法10問の平均得点)を元に高群と低群を構成(2水準)
要因2:「阪神ファン度」(5件法10問の平均得点)を元に高群と低群を構成(2水準)

 以上のような研究があるとして、この分析方法に困っています。このような場合、2要因の分散分析(「星野監督ファン度」2水準×「阪神ファン度」2水準)を行っていいのでしょうか?当然、「星野監督ファン度」と「阪神ファン度」には強い相関がみられるので(例えば.6としましょう)、2要因の分散分析が成立するのか疑問なのです。

 ちなみに、各群の被験者数も、2つの尺度の強い相関の結果、阪神ファン度と星野監督ファン度の両方が高いか両方が低い群に集中し、阪神ファン度低&星野監督ファン度高群と、阪神ファン度高&星野監督ファン度低群の2つの群はほとんど被験者がいません。(この時点で分散分析がかなり苦しいのですが、GLMのTypeIIIの検定などで被験者数の片寄りを考慮した上での分散分析ができるとします)

 以上のような、二つの要因に強い相関が見られる場合の分散分析は、どのように処理すればいいのかアドバイスを戴ければ嬉しいです。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

再度登場します.



>つまり、この場合だと、2×2の2要因分散分析のかわりに、
>1要因2水準の分散分析を行うということになるわけですよね?

その通りです.一要因に水準データなのでt検定でも適用できます.
ただ,残念ながらこの方法では質問者さんの目的が検討できない,と(むむむ,かなり手強いなぁ)

>今回の研究では、「星野監督ファン要因」と「阪神ファン要因」
>のどちらがより強く「阪神グッズ購入」に影響を与えているかを
>検討できればと思っています。

うーんうーん.
独立変数間の相関が低ければ,重回帰分析が使えるのでしょうが,相関が高いので「多重共線性」の問題が生じますし……
かりに,かりに多重共線性を無視してしまえば……0.6の相関で無視するというのもかなり問題がありますが……無視をしてしまえば,重回帰分析では,各独立変数ごとに「その変数の影響性が有意であるか(t値,及びその確率で判定)」,また,「どの程度影響性があるか,影響の程度(標準偏回帰係数,β)」が算出されるので,標準偏回帰係数を見れば,変数1のβと変数2のβとを比べるということで調べることができる……のですが……

>なければ、相関係数の強さを記述的に比較するしかないのかなと
>思っています。

そうですねえ.これも最終手段かもしれませんね……
あと,相関係数を算出するならば,偏相関係数を求めることにより.独立変数間の共変分を除去して考察することもできます.

今回はピンとくる回答ができずに申し訳ないです.
    • good
    • 0
この回答へのお礼

 たびたびのお返事ありがとうございます。今回も大変分かりやすいお返事で、感謝感激です。

 重回帰分析は、私も考えました。でもやっぱり、多重共線性にひっかかりますよね。.6じゃ、厳しすぎます(涙)。

 偏相関係数は、気付きませんでした。なるほど、そういう手がありますね!偏相関係数は今まで一度も使ったことがないので、速攻で勉強してみます。この方法なら、共通部分を除いた残りの部分で、どちらの要因がより強く「阪神グッズ購入金額」に影響を与えているのか比べることができそうです。願わくば、一方の要因が有意な相関で、もう一方が有意な相関でなければいいのですが(両方有意だと、偏相関係数の大きさを記述的に比較することになるので、骨が折れます)。

 今回は、本当にお世話になりました。またご縁がありましたら、よろしくお願いします。

お礼日時:2004/01/26 22:43

こんにちは.



「独立変数(原因)→従属変数(結果)」の図式を使った統計解析法である分散分析を使用する場合にはいくつかの前提条件があります.
各変数の平均値が母集団正規分布から抽出されている,分散が等しい,などが比較的有名ですが,その他にも,独立変数が独立している(独立変数間には相関がない,低い)というのも挙げられるでしょう.
最近は多少の相関があっても修正はされるの【かも】しれませんが,基本的には上記の前提があるようなので,例に挙がっている「星野監督ファン要因」と「阪神ファン要因」という,相関が強いデータでは「分散分析」を使うのが不適切である,と判断できます.

実験計画法や心理学研究法の授業であるならば,そのような相関がある要因を採用するな,と一言で片づけられるかもしれません.しかし実際にそのようなデータを取ってしまった後では,何とか分析をしなければならないでしょうので,次のような対処法をされるとどうでしょうか?

今二つの要因の相関が高いわけなのですから,そして分散分析は相関が高い要因を使ってはいけないのですから,ならば「相関の高い二つの要因」を「一つの要因」としてまとめるのはどうでしょうか?
相関が高いのであれば「星野:高&阪神:高」あるいは「星野:低&阪神:低」というように,両要因とも高いあるいは低いわけですから,これを一つの要因としてまとめても問題はないと思われます.
このまとめの作業として「因子分析」を使ってみてはどうでしょうか? 「星野」変数と「阪神」変数の二変数データに対して因子分析を行い,一因子の因子分析を行い,その因子得点を,改めて「独立変数」として採用すれば良いのではないでしょうか? (一変数の場合ならば,回転がないので,因子分析も主成分分析も同じことですね…)

1)相関の高い独立変数を因子分析にして,直交回転を行い,因子得点を新しい独立変数として採用する.
2)直交回転による因子得点なので,新しい独立変数は相関がない独立変数なので,安心して分散分析が使える.

例えば私ならば,このような方法をとりますが,いかがでしょうか?
    • good
    • 0
この回答へのお礼

 回答ありがとうございます。なるほど!やっぱり、二つの要因は独立している必要があるのですね。そうでないとNの数が偏るし、何だかおかしな分析になるなと思っていました。分かりやすく説明して下さって、ありがとうございます。

>しかし実際にそのようなデータを取ってしまった後では,何とか分析をしなければならないでしょう
 (^_^;;)。ご配慮ありがとうございます。ついでに甘えて、もう少し質問してよろしいでしょうか?
 まずは確認です。新しく教えていただいた方法は、なるほどそんな手があるのだと目からウロコでした。つまり、この場合だと、2×2の2要因分散分析のかわりに、1要因2水準の分散分析を行うということになるわけですよね?
 さらに追加の質問。今回の研究では、「星野監督ファン要因」と「阪神ファン要因」のどちらがより強く「阪神グッズ購入」に影響を与えているかを検討できればと思っています。つまり、教えていただいた新しい方法は今回の研究には適さなさそうなのです。このような場合に使える検定をご存知でしょうか?「影響を与えていない」という帰無仮説を棄却する検定(=影響を与えていることを示す検定)はあっても、「A尺度よりB尺度のほうが有意に影響を与えている」ことを示すことができる検定はないのでしょうか?なければ、相関係数の強さを記述的に比較するしかないのかなと思っています。
 ・・・もともとの研究計画が悪くて自業自得なのですが、お返事もらえれば嬉しいです。

お礼日時:2004/01/26 01:46

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qカイ2乗検定って何??;;

タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

Aベストアンサー

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.

例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.

さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40

当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40
(3)ズレ    +32   -17   -14   + 9
(4)ズレ二乗 1024   289   196   81
(5)(4)÷(2) 25.6  7.225  4.9  2.025

 χ2=25.6+7.225+4.9+2.025=49.25

計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.

さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.

以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.

χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.

質問者さんの場合は

> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、

これを理論値としてうまく設定することが鍵となるでしょう.

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布...続きを読む

Q統計の分析について、教えてください。

現在、大学(心理学専攻)の課題をやっているのですが、
分析にどの手法を使えばよいのかがわかりません。

重回帰分析、分散分析、t検定の、それぞれの特徴、
どういった場合に用いればよいのかを教えてください。
よろしくお願いいたします。

Aベストアンサー

こんにちは。
私は,統計手法を「差異を調べる」手法と「類似を調べる」手法に大別して整理しています。t検定と分散分析は「差異を調べる」手法,重回帰分析は「類似を調べる」手法に分類することができるでしょう。

t検定と分散分析は「差異を調べる」手法に分類したように,複数の条件における平均値に違いがあるかどうかを調べる場合に使われます。もともとはt検定しかなく「二条件の平均値の差異」を調べる時に使われました(実際のt検定の定義は異なるのですが,心理学専攻生にイメージしやすい説明を優先しています)。しかし,実験や調査によっては,二条件だけではなく,「三条件以上の平均値の差異を調べたい」と思うことがしばしばです。このような思いに応えるべく開発されたのが分散分析です。
さらに,開発するときに,要因/水準という概念を導入して便利な分析道具となっていきます。分散分析は平均値の差異を調べる手法ですが,その平均値の差異がどのような原因(独立変数)に起因するのかを調べることができるのです。例えば,二要因の場合,平均値の差異が,「要因Aによるものなのか」,「要因Bによるものなのか」,「あるいは要因AとBの交互作用によるものなのか」,これらのいずれの影響によって平均値の差異が生じたといえるかを調べることができます。「差異を生じさせた」ということは,その要因の影響力があったと判断することができますね。

これに対して,重回帰分析は,複数の原因候補(独立変数)と一つの結果(従属変数)がどれぐらい類似しているかを調べることを通して,従属変数に,それぞれの独立変数がどれぐらいの影響力を与えているかどうか(また,その影響力は統計学的に意味があるといえるのか)の判定をする手法です。

このように考えると,両方とも「複数の原因(独立変数)が一つの結果(従属変数)に影響を与えているかどうか」という枠組みで検定を行う手法として共通しています(このため,両者は「線型モデル」という上位概念でくくることができます)。実際,同じデータに対して,分散分析と重回帰分析の両方を使うこともできます。

しかし,【通常の使い方をするならば】,分散分析は「要因(独立変数)間の交互作用を仮定して」分析を行う,重回帰分析は「独立変数間に交互作用を仮定せず」分析を行う手法であると考えるのが,とりあえずの理解としては良いのではないでしょうか?(工夫次第では,重回帰分析でも交互作用を仮定できますが,話が複雑になるので割愛)

こんにちは。
私は,統計手法を「差異を調べる」手法と「類似を調べる」手法に大別して整理しています。t検定と分散分析は「差異を調べる」手法,重回帰分析は「類似を調べる」手法に分類することができるでしょう。

t検定と分散分析は「差異を調べる」手法に分類したように,複数の条件における平均値に違いがあるかどうかを調べる場合に使われます。もともとはt検定しかなく「二条件の平均値の差異」を調べる時に使われました(実際のt検定の定義は異なるのですが,心理学専攻生にイメージしやすい説明...続きを読む

Q共分散構造分析とは?

項目応答理論とは別にもう一つ質問させていただきます。共分散構造分析というものが一体どういうものなのか教えてください。なぜ適合度の判定が出来るのかなどに触れていただけると嬉しいです。卒業論文で利用する予定なので、この理論について学部生として必要な分だけは理解しておきたいと考えています。主観で結構ですので、この点も踏まえて回答お願いします。

Aベストアンサー

こんにちは.

項目応答理論も共分散構造分析も,名前はよく聞き,実際注目されているが,その原理を正しく理解して使っている人は少ない……というのが,学部生だけでなく,院生や先生レベルにおいても現状です.いわゆる数理的側面からこれらを理解するのは,心理学者としてはいささか荷が重く,少なくとも,t検定や分散分析のように「知っていなければいけない」というものではなく,使いたい人が最低限のことを知っておくという性質の分析法でしょう.

私自身も共分散構造分析についてはよくしりませんが,人に説明する時に以下のようなイメージ的説明をします.

共分散構造分析は,それまでの統計解析法を包括する優れた手法……なのですが,この説明では何がすごいのかよく分からないでしょう.

心理学者が結果の解釈や使い方は知っておくべきとされる統計解析法に「重回帰分析」と「因子分析」があります.
重回帰分析は「原因→結果」の図式を適用して,【想定したモデル内において】原因や結果が何であるかを考えるものです.科学の究極的な目的として「単なる相関関係ではなく,因果関係を調べる」がありますが,その意味では重回帰分析はなかなか有効です.しかし,重回帰分析の問題点は「観測変数」しか扱えない,実際に測定した数値しかモデル内に組み込めないというものがあります.
対して因子分析は,観測変数のデータから,その背後にある因子という「内生変数」について調べることができるものです.人々が持っている(だろう)知能という内生変数は形がないので直接調べることができませんが,それをテストを使って「知能指数」という「観測変数」形として調べることができますしかし知能指数が,その人の知能を直接反映しているかというとそんなことはなく,間接的に測定しているに過ぎません.このような間接的な情報である「因子/内生変数」を調べることができる因子分析ですが,問題点は自分が想定する「原因→結果」の図式を使えない,と言うことが挙げられます.

このように,重回帰分析は「自在に原因-結果を想定でき」ますが「内生変数を扱えない」,対して因子分析は「内生変数を扱える」が「自在な原因-結果を想定できない」と,それぞれに長所短所があります.
……このように書くと,流れから推測できると思いますが,共分散構造分析は「内生変数を扱える」かつ「自在に原因-結果を想定できる」というように両方のいいとこ取りができるのです.なぜならば,共分散構造分析は重回帰分析や因子分析を包括するモデルだからです.更に言えば,分散分析やその他の統計解析法の多くも,包括しています.まさに共分散構造分析は統計解析法の王様と位置づけることができるでしょう.

以上で共分散構造分析の偉大さの一端は分かっていただけたと思います.つまり共分散構造分析一つあれば,その他の統計解析法の多くは不必要になる可能性もあります.

ただし!

これほどあまりにも便利な統計解析法ですが,無論欠点も存在します.共分散構造分析がこれほどの汎用性を持つにはそれなりの【代償を必要】とします.
そもそも共分散構造分析が汎用性を持ちうるのは何故かというと,予め組み込まれている前提条件が少なく,実際の分析をするためには分析者があれこれと指示をしなければならない,からです.重回帰分析では「観測変数のみを扱う」「従属変数は一つだけ」などのように予め前提条件が存在します.この前提条件が枷になることもありますが,逆に言えば,そのような枷があるからこそ,その前提条件について悩む必要がなく習熟が簡単なのです(因子分析にも前提条件が当然あります).しかし共分散構造分析では,その前提条件がないので,逆に言えば,わざわざ指定しなければなりません.

突飛なたとえをします.どこかに移動する場合様々な移動手段が存在します.例えば「歩いて移動」「車で移動」「飛行機で移動」などなどです.「歩いて移動」しかできないAさん,「何でも移動できる」Bさんがいるとしましょう.とにかく「○○に行け」と指示を出す場合,Aさんだったらその指示が出た瞬間,何のためらいもなく,目的地に向かって歩き始めるでしょう.対してBさんは,「○○に行け」だけの指示では動けません.具体的にどのような移動手段かを指示しなければなりません.このように様々な手段を持つ人に対しては,細々とした具体的な指示をしなければなりません.Aさんは前提条件がある(「車で移動するな」「飛行機泥どうするな」)重回帰分析タイプです.Bさんは前提条件がほとんどない共分散構造分析タイプです.

話を戻しますが,共分散構造分析の大きな欠点の一つとしては「自分であれこれと命令,指定をしなければならない」という点があります.簡単に言えば,データに対してかなり明確な仮説モデルがないとだめなのです.「よく分からないけどとりあえず分析をしよう」ということができません.他にも大量データでなければならない,などの欠点もありますが,最大の欠点は上記の「あれこれの指定」でしょう.しかし逆に言うと「あれこれ指定しなければならない」とは「あれこれ指定できる」となり,欠点が長所に転じます.
この意味で共分散構造分析は,それまでの統計解析法の前提条件に満足できない人が,前提条件そのものをいじって,自分であれこれモデルを作りたい,というような玄人好みの統計解析法であると言えるのではないでしょうか?

長くなりましたが,最後に「適合度の判定」についてごく簡単に.
適合度の判定とは,要するにそのモデルが適切かどうかを判断する指標がある,ということでしょうか? その意味でしたら,実は多くの統計解析法にそのような「適合度の判定」に類するものがあります.重回帰分析ではモデルの分散分析(F検定を使ったもの)が該当します.
適合度の判定は,予測値と実測値がどれほど合致しているかを示しますが,共分散構造分析とは先に散々繰り返したようにモデルを作ります.すると,モデルによる予測値と,実際のデータ実測値とを比べることにより,そのモデルがデータに適合しているかどうかを調べることができます.

> なぜ適合度の判定が出来るのかなどに触れていただけると嬉しいです

大抵の統計解析法の多くには,適合度の判定に類するものは実装されています(因子分析が例外的ですが.但し,因子分析も最近のオプションによっては適合度の判定ができるそうです).

最後に.
共分散構造分析は,最初に述べたように,必要な人が困らない程度にがんばって理解する,という性質の統計解析法です.そのために学部生の場合であれば,論文でこの分析法が使われている場合は結果の数値の解釈だけできれば,ひとまずokだと思います.使う場合でも,自分が使う範囲で困らない程度の習熟すれば良いと思います.

こんにちは.

項目応答理論も共分散構造分析も,名前はよく聞き,実際注目されているが,その原理を正しく理解して使っている人は少ない……というのが,学部生だけでなく,院生や先生レベルにおいても現状です.いわゆる数理的側面からこれらを理解するのは,心理学者としてはいささか荷が重く,少なくとも,t検定や分散分析のように「知っていなければいけない」というものではなく,使いたい人が最低限のことを知っておくという性質の分析法でしょう.

私自身も共分散構造分析についてはよくしりませんが...続きを読む

Qt検定と1×2の分散分析の違い

ある統計の本に、t2乗=Fであり、
t検定と1要因2水準の分散分析は同じだ、と書かれていました。

そうすると、t検定が存在する意味がなくなってしまう
(分散分析だけですんでしまう)ことになると思うのですが、
なぜt検定をするのでしょうか。

Aベストアンサー

bon-chanさん,こんにちは.

以前bon-chanさんと同じように悩んだことがあります.以下,自分なりの結論を述べます(これが正解かどうかは保証しません).

t検定と1×2分散分析は御指摘通りに同様の結論を導きます.そして,分散分析は1×2だけでなく,それ以上の複数の平均値の分析をすることができます.これだけを考えるならば,t検定には利用価値がないような気がします.しかし,いろいろと考えてみるとt検定にはやはり十分価値があります.

1)一つの平均値の検定において有効

t検定の使用法は,心理学領域においては,二つの平均値の比較のために使われています.しかし,t検定の最も基本的な使われ方は「ある数値が基準値と比べて有意に離れているか」というものです.統計法の教科書では「一つの条件の平均値の定数との関係を調べる検定」として説明されているでしょう.比較の手法が頻繁である心理学ではあまり使用されませんが,重回帰分析の偏回帰係数の有意検定はこの種類のt検定が使われています.

2)多重比較の原理として

分散分析では「要因全体として」有意であるかどうかを教えてくれますが,どの水準とどの水準との間に差があるかを教えてくれません.このために多重比較を行うわけですが,この多重比較の計算式をよく見るとt検定と類似しています.御存知の通り,t検定をそのまま使用しては多重比較としては不適なのですが,t検定を修正することによって多重比較の計算を行うことができます.

3)計算が簡単

上記の1)と2)は,あるいは1×2の分散分析で代用することができるかもしれません.しかし1×2の分散分析とt検定を比べた場合,t検定の方が圧倒的に計算が簡単です.対応なし要因に限定をすれば,二つの変数の平均と分散が分かっていればt検定をすることができますが,分散分析の場合は,原理的には個々のデータの平均値からの偏差を必要とします.つまり分散分析の方が計算が複雑なのです.

このように,t検定と分散分析では,その実用性からすれば分散分析に軍配が上がりますが,その基本的原理や簡便性などからt検定の価値が認められます.
変なたとえをすれば,四則演算の計算問題を解くときに,手軽な電卓を使うか,あるいは,わざわざ起動してExcelなどの表計算ソフトを使うか,などの違い,と考えています.

bon-chanさん,こんにちは.

以前bon-chanさんと同じように悩んだことがあります.以下,自分なりの結論を述べます(これが正解かどうかは保証しません).

t検定と1×2分散分析は御指摘通りに同様の結論を導きます.そして,分散分析は1×2だけでなく,それ以上の複数の平均値の分析をすることができます.これだけを考えるならば,t検定には利用価値がないような気がします.しかし,いろいろと考えてみるとt検定にはやはり十分価値があります.

1)一つの平均値の検定において有効

t検定の使...続きを読む

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング