相関係数というのはどういうときに使う統計手法なんでしょうか?そこから何が分かって、何は言えないのでしょうか? 教えてもらえませんか。。?

このQ&Aに関連する最新のQ&A

A 回答 (3件)

まず.相関分析と回帰分析の違いから。

話を簡単にするために2次元にします。

回帰分析は.特定の値を測定者が決めて.その値に対応する値を測定し.両者の関係から.回帰線を求める方法です。この場合に「測定者が決めた値に誤差がまったくない」ということが統計処理の前提になっています。測定値については.「平均値を持つ」ことが前提になっています。つまり.測定値は平均付近にガウス分布をで存在する事になります。又.多くの場合に測定値の間隔がほぼ等しい事.最大測定値と最小測定値の間だけ意味を持ち.外装した場合には誤差が大きすぎて実質的に意味を持たない事が多いです。

次に相関分析についてですが.これは.任意の点を測定した場合に得られる2つの測定値の関係を示します。したがって.測定点それぞれが誤差を持ちます。
2つの測定値は.平均値を持つ必要があります。つまり.平均値の左右にガウス分布で適当にばらついている必要があります。もし.ガウス分布以外の分布を示した場合には.相関曲線の意味を持ちません。度数分布を取ると.前者(通常横軸にとる)の真ん中あたりに中心を持つ相関曲線を中心とする楕円状の分布を取ります。
この測定法を使う場合には.なんだかの理由で特定の値に設定できない場合(外気温の影響など)に使用します。
相関分析に使われる相関曲線のそばにどの程度測定値が集まっているかを示すのが.相関係数です。注意点としては.「Xとyとの間に相関はある」という検定は出来ます。しかし.「相関はない」とする検定は実質的に出来ません。したがって「相関がある」という結論を出す事はかのうですが.相関係数が低く有意でない場合においては「わからない」ということになります。特に心理学のような分野においては.危険率5%検定で優位となる相関係数が0.9以上のような場合でさえ.相関係数0.5もあって意味があるという議論がなされています。「相関がある」場合と.「相関があるかどうか分からない」場合の2つに分ける事ができるのが.相関係数(と派生して計算できる数値を含めた)検定です。「相関がある」という言葉は(正確さが欠けますが)「従属する」という意味に近い面があります。
相関係数単体では計算できませんが.その他の数値を使うと信頼限界も計算できます。

相関分析も回帰分析も計算方法はほぼ同じなのですが.前提とする誤差と分布が異なります。両者の違いを理解してください。
    • good
    • 0

統計的には、回帰式と相関係数の2つが重要です。


とりあえず、(X,Y)の2次元で話をすすめます。
得られたデータでグラフ上に点を打ちます。(散布図)
ここで、データが円状になっていれば仕方がありませんが、右上がりとか右下がりの傾向が出ていれば、回帰式を仮定し係数を計算します。(最小二乗法)

ところが、データが楕円状の時と、データがほぼ直線状になっているときでは同じ回帰式であっても、意味合いが全く違います。
この回帰式の信頼度(確からしさ)を示すのが相関係数です。データが直線になれば相関係数は1、円になれば0、楕円なら0.5くらいと言う事になります。

良く、回帰式だけ計算して結論を導くと言う事をやりますが、相関係数が小さければ、誤った結論を導いてしまう事にもなりかねません。それを防ぐのが相関係数です。
    • good
    • 0

「確率・統計入門」(岩波書店)によると、



相関係数というのは、xとyがどれくらい関連しているかを表す指示数であり・・・

と書かれています。つまり、xとyが独立なら、相関係数は0になり、相関係数が1であれば、yはxの一次関数で表すことができる、ということです。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Q相関分析の相関係数と重回帰分析の偏回帰係数の違いの説明

実は会社での説明に苦慮しています。
例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。
どなたかお知恵をいただきたく、よろしくお願いします。

Aベストアンサー

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チームの防御率をX1、チームの打率をx2、すなわち、説明変数を複数(2つ以上)採り、順位yの推定を行うのが、重回帰分析です。
 このように、単回帰分析よりも、重回帰分析の方が、必ず相関係数が高くなります。すなわち、結果の推定の確実性が増すわけです。相関係数が、1.0になれば、説明変数の事柄だけで、従属変数の事柄が決定できます。すなわち、100%的中します。

 単回帰では、防御率、打率とも、相互の影響は考慮されていません。従って、防御率と打率のどちらが影響力が強いのかは、相関係数から予測はできるものの、決定できません。選手をとる場合、同じ年俸を払うのに、ピッチャーとバッターのどちらを補強したら効果的かは、判断が困難です。
 このとき、どちらの影響が強いかを推定できるのが、重回帰分析です。そのために利用するのが、偏回帰係数ですが、変数の単位に左右されるので、注意を要するところです。

 「単回帰では、(1)(2)(3)のどれが最も効果的かは、判断できません」が答えでしょうか。
 釈迦に説法の点は、ご容赦を。
  

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チー...続きを読む

Q相関係数と決定係数

素人質問で恐縮ですが相関係数と決定係数の違いを教えてください。
相関係数を2乗すると決定係数になるというのは分かるのですが、それぞれの指標をどのように見ればいいのかわかりません。大変恐縮ですがよろしくお願いいたします。

Aベストアンサー

以下のURLは参考になるかと思います。

http://www.geisya.or.jp/~mwm48961/statistics/coef_det1.htm

疑問点が解決すればいいのですが。

Q統計学の相関係数について

直線のときに相関係数が最大・最小をとるとありますが何故直線のときなのでしょうか?

自分なりの考えでは、第1~4象限すべてに散布していると相殺して0になるように、たとえ第1・3象限に留まっていようとその中でプチ相殺してしまうから、そうならない究極の形が直線であったのでないか説を立てましたが実際どうなのか疑問です

Aベストアンサー

相関係数をr, Xi の平均値を x , Yi の平均値を y とする。

r=Σi{(Xi -x)×(Yi -y)}/{rootΣi(Xi -x)^2 ×rootΣj(Yj -y)^2}

y=ax+b のとき、

r=Σi{(Xi -x)×a(Xi -x)}/{rootΣi(Xi -x)^2 ×rootΣja^2(Xj -x)^2}

= a / lal

=±1

こんな感じでどうでしょうか?

Q統計学、共分散・相関係数です

    Y=1 Y=3
X=2 2/8 1/8
X=4 3/8 2/8

 という同時確率分布における共分散と相関係数なのですが…XとYの共分散は1/16、相関係数は400/289と出たのですが…合ってあるでしょうか?すごく間違ってる気がするのですが(>_<)。

 間違えていましたら、正しい答えを教えて頂けたら非常に助かります;。ヒントでも結構です。お願いします!

Aベストアンサー

全部答えるとルール違反なので概略だけです。

共分散はあってます。

相関係数は必ず-1と1の間にあるので間違いです。相関係数は
ρ = Cov(X,Y) / √{Var(X)*Var(Y)}
なので、X と Y の分散(大体1くらいになります)を求めれば計算できます。

Q統計学 相関係数の算出に関する質問

統計学 相関係数の算出に関する質問

統計学の勉強中ですが、以下の問題で悩んでます。

「10個のデータの組(Xi,Yi)があり、Xの総和が20、Yの総和が20、X^2の総和が50、Y^2の総和が50、XYの総和が30である。
最小二乗法で回帰直線を求め、その上で相関係数を求めよ。」

最小二乗法で回帰直線の方程式が Y=-X+4 であることは求められましたが、
その次の相関係数の算出でつまづいてます。

どなたか、解法を教えてください。

補足ちなみに、Excelではなく手計算での算出です。
同様の問題を自力で解答できるように、
途中式等の解法の説明も、よろしくお願いします。

Aベストアンサー

添付図をご覧ください。

偏差の和をSで表しました。

回帰係数(傾き)を求めた計算同様に,
Syyを求めて計算すればよいのです。


人気Q&Aランキング

おすすめ情報