A群とB群のデータがある場合、A群の値にB群の値はどれだけ近いか示すために相関係数を用いたのですが、その後、重相関係数があることを知りました。
しかし、相関係数と重相関係数の違いがよくわかりません。
相関係数と重相関係数の違いや、用いるべき現象等について、ご存知の方がいましたら教えてください。よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

相関係数と重相関係数はそれほど違いのある指標ではありません。


重相関係数は最小2乗法においてモデルの説明力をあらわす、
決定係数のルートをとったもののことです。
重相関係数は重回帰分析の際に用いられるものです。
単純回帰の場合は同じ値になります。
ここでは比較対象が2つしかありませんし、
回帰分析をおこなうわけでもありませんから
同じ値になるということです(+-の符号は別にして)。
比較対象が複数個ある場合は
重相関係数に意味が出てきます。

これよりも重要なことは、
相関係数は両者の線形関係の強さを
あらわすものでしかないということです。
もし、A群とB群の関係が円の関係であれば、
相関係数の値は0となりますが、
依然として「円」の関係は存在します。
もうひとつの注意点は
はずれ値に対して頑健ではないということです。
例えば、10個のデータがあって、そのうち9個までが
ある線形関係を満たしていたとしても、
1個が大きくその線上からずれていると
相関係数は急激に小さくなり、
正しい関係を示さなくなってしまいます。

ちなみに
「A群の値にB群の値はどれだけ近いか示すために」
とありますが、この文の通りに解釈すれば
相関係数を用いること自体あまり意味があるとはいえません。
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QSPSSにて相関係数rを出したのですが、評価の仕方がわからない。

かなり基本的な質問で申し訳ないのですが、
相関係数rについて教えて頂きたいです。

ヒトの体重(kg)とエンゲル係数をデータとして、
統計ソフトSPSSに入力し、相関係数rを出力しました。
すると、r=0.56とでました。
相関係数rは1に近ければ近いほど相関が高いことくらいしかわかりません。
相関係数r=0.56の場合、相関があるといってよいのでしょうか?
評価方法が初学者にも勉強できる本などあれば、教えて頂けますでしょうか?
どうぞ宜しくお願い致します。

Aベストアンサー

 まず、散布図を描きます。直線が描けそうなら直線の回帰。社会現象だと、直線より、データーを対数変換したら直線になるとしいう対数回帰などもあるので、とにかく散布図をじっくりながめる。
 実際には、エクセルを使い、散布図を描きます。
 散布図から、最適の回帰式を選び、そのその式と相関係数を散布図上に表示します。
 
そして、その関係が有意か否かの検定をします。これは、自由度(=データー数 - 2)と相関係数からt検定を行うようです。初心者の私には、原理は理解できませんが、ちょっとした本なら、巻末に、その表がありますので、それを見ています。

 相関については、相関係数が0.7以上だと、強い正の相関、という表現をするようです。

>相関係数r=0.56の場合、相関があるといってよいのでしょうか?
上に述べたように、データ数によります。
 自由度11(データー数13)以上なら、危険率5%で有意差あり、すなわち、相関がある、と主張できます。
 
 次に因果関係の判定には、時間性、密接性、特異性、普遍性、合理性の5要件をすべて満たさないと、擬相関かもしれません。この5要件は、7要件、9要件とする説もあるし、名称も異なったりします。また、その意味もわかったような気になりますが、実際にはどうしてよいやら、ですので勉強する必要があります。たとえば、普遍性については、一致性の名称で、これまでの事例に反しないこと(一致すること、などの判定には何の役にもたたない説明も見ます)、なんぞの説明かあったりします。これまでの事例に話ないとは、具体的にどうなのか、どうやれば判定できるのかは、その説明からは無理だと思います。
 ただ、合理性だけは、これは経験のみ。他は、なんとか判定できるように説明できますので、判定に困ったら書きこんで下さい。

 それから決定係数も、勉強して下さい。相関係数より、意味がありますが、何故については、数式がよくわからないので理解できていません。

 まず、散布図を描きます。直線が描けそうなら直線の回帰。社会現象だと、直線より、データーを対数変換したら直線になるとしいう対数回帰などもあるので、とにかく散布図をじっくりながめる。
 実際には、エクセルを使い、散布図を描きます。
 散布図から、最適の回帰式を選び、そのその式と相関係数を散布図上に表示します。
 
そして、その関係が有意か否かの検定をします。これは、自由度(=データー数 - 2)と相関係数からt検定を行うようです。初心者の私には、原理は理解できませんが、ちょっとし...続きを読む

Q重回帰分析におけるP値とデータ数の関係について

レポートで重回帰分析を用いた実証分析を行っているのですが、重回帰分析に関しての質問があります。

内容としては、企業のコスト構造に一定の費用関数を推定し、コストを被説明変数、その他の説明変数を複数推定して、そのパラメーター(2~3つ)を重回帰分析で求めるもの内容となっています。

財務データを年代順に収集し、上記の分析方法で計測したところ、分析結果(推定式)のR2はデータ量が増加しても良好に推移しています。
ところが、複数ある説明変数の一部のP値が、1%⇒5%⇒10%・・・と、どんどん大きくなってしまい、説明変数として有意でなくなってしまいました。

【質問1】
データ量の増加とともにP値が大きくなるのは、データ量の増加に伴い推定式における当該説明変数の説明力が減少した(有力な説明変数でなくなっている)、という理解でよいのでしょうか?
【質問2】
P値の説明力を維持する(P値が大きくならないようにする)方法はあるのでしょうか?

以上です。
知識のある方には愚問かも知れませんが、何卒よろしくご回答をお願い致します。

Aベストアンサー

事情は分りました。

【質問1】統計学では、データ数が増えるほど有意差は出やすい、というのが原則です。単相関だと、p<0.05の水準で、データ数が10だと相関係数は0.57以上ですが、100もあると0.19。相関係数が0.19の散布図を見れば、てんでバラバラ。関係あるとは思えないような図です。重回帰は、単回帰の延長なので、原則は同じのハズ。
 この原則に反するのは、多重共線性の問題が考えられます。説明変数どうしの相関が、0.5程度でも引っかかるようです。どれくらいだとクリアできるのかは、知りません。
【質問2】データがあれば、正しい方法はひとつしかないので、それに則って計算する限り、ありません。データを捏造するなどなら可。

p値を重視されていますが、No1にも書きましたように、これから言えるのは、「有意差がある」→ それをつかっても、間違いである確率は、5%以下、ということのみ。
 回帰式の目的は、どれくらい予想(推定値である従属変数)を的中させるか、でしょう。この場合は、両者の関係の強さを説明するrを1に近づけるのが適切。ただ、rは、データ数が増えると小さくなります。
 一番は、多重共線性に配慮しながら、説明変数を増やすこと。そうすれば、rの値は、1に近づきます。それは、曖昧さ(回帰式との距離)が少なくなるからです。教科書的には、説明変数を増やして、その変数についてF検定をして、p<0.05なら採用、そうでなければ排除、と書いてあります。が、私は、rの値が少しでも1に近づくので、排除しません。

事情は分りました。

【質問1】統計学では、データ数が増えるほど有意差は出やすい、というのが原則です。単相関だと、p<0.05の水準で、データ数が10だと相関係数は0.57以上ですが、100もあると0.19。相関係数が0.19の散布図を見れば、てんでバラバラ。関係あるとは思えないような図です。重回帰は、単回帰の延長なので、原則は同じのハズ。
 この原則に反するのは、多重共線性の問題が考えられます。説明変数どうしの相関が、0.5程度でも引っかかるようです。どれくらいだとクリアできるのかは、知りません。...続きを読む

Q相関係数が1になるのはなぜ

データ群Aとデータ群Bの相関係数を調べようとしています。
データ群Aはy=x
データ群Bはy=2x-5
0<=x<=10

このデータ群の相関係数を
共分散/(√Aの分散×√Bの分散)
で計算すると相関係数が1となります。

明らかにデータ群AとBが違っているのに相関係数が1になるのはなぜなのか、また、このデータ群の相関係数の正しい求め方を教えてください。
よろしくお願いします。

Aベストアンサー

リンク先あたりを読むと良いかもです。簡単に言えば「どのくらい比例関係(線形従属の関係)に近いか」を示す指標のようなものなので、比例していれば1(または-1)になります。

y=ax+bで、
xの平均値をpとすれば、yの平均値はap+bですからyの分散は
√Σ(a(Xn)+b-(ap-b))^2
=√Σ(a(Xn-ap))^2
=√Σ(a・(Xn-p))^2
=a・(√Σ(Xn-p)^2)

一方、xのほうはというと
√Σ(Xn-p)^2
なんで、両者を掛け算すると、
a・(√(Σ(Xn-p)^2)^2)
=a・(Σ(Xn-p)^2)

で、分子を見ると、
Σ(xn-p)(a(Xn)+b-(ap-b))
=Σ(xn-p)(a・(xn-p))
=a・(Σ(xn-p)^2)

なーんだ、一緒ジャン・・・とな

参考URL:http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0

Q回帰分析:理論値と実績値の差異の考慮

回帰分析の理論値と実績値の差異を将来予測に反映させるべきか悩んでいます。アドバイス頂ければ幸いです。以下の例を念頭に置いています。

国内総生産と県内総生産の動きから将来の県内総生産の予測値を算出する際に、過去の理論値と実績値の差異を調整値として県内総生産の予測値に反映させるべきなのでしょうか?

Aベストアンサー

 回帰式上の点と差異が出るのは、未知の要因が計算式に入っていないから。

 例えば、株価(日経平均など)は、その国のGDP、人口、・・・、など多くの要因に影響されるでしょうが、プロでも当たりません。未知の要因が入っているからです。しかも、実社会では、要因が絡み合っていて(交絡因子)、解析しきれません。ですから、ドツボに入ってしまいます。
 たとえば 交絡因子とは、酒がガンと関係していると計算できても、酒を飲む人は喫煙もするので、実際にはタバコが真の原因、という場合です。
 
 複数の要因が推定されるときは、重回帰分析をすれば、差異は小さくすることはできます。例えば、プロ野球のチーム防御率と順位は、回帰式が成立するようです。ここにチーム打率を入れ重回帰分析をすれば、予測と実際の差異は小さくできるようです。
 ですが、重回帰は、専門家でも結果の解釈を間違っている場合が少なくありません。

Q相関係数って

今、大学の卒論で色々な相関係数を使って研究しようと思いますが、正直あまりよくわかりません。
なので、相関係数について、誰でもわかるように、また、卒論で載せれるような、詳しいことなどみなさまの理解している相関係数について教えてください。
よろしくお願いします。

Aベストアンサー

相関係数は似ているかどうかよりも、関連が有るかどうかを調べるものですね。

No.2さんが一般的な相関係数を列挙されていますが、それ以外にも偏相関係数というのがあります。これは、ある変数Aと変数Bに関連があるという結果が出た時に、じつはそれは他の変数Xの影響で関連があるだけだった。ということがあります。偏相関係数ではこのようなほかの変数(ここではX)の効果を取り除いた時の関連性を求めるものになります。

また、以前の回答と上記の偏相関係数も基本的には線形な関連性を求めるだけになります。この相関係数では、非常に単純な2次関数で表現できるような関連を相関係数で計算するとほぼ0(無相関)という結果になり、関係性を取り出すことが出来ません。
このような場合の相関係数にカルホーン相関というものがあります。

卒業論文で多少目新しいのもを行いたいならカルホーン相関なんか面白いかもしれませんね。

Q計量経済モデルで不必要な相関を取り除く方法

2008年に食料価格高騰が起こりました。
同時にその時期に石油の価格高騰も起こりました。
また同時にアメリカドルの下落も起こりました。

グラフにして見ましたが、一見、非常に相関が強く見えます。
すなわち、食料価格の上昇するタイミングや傾向が
石油価格やアメリカドルの下落のものと似ています。

もし、食料価格の高騰がなぜ起こったのか?というものを
調べたい時にどのような方法を用いれば、それらが
本当に食料価格を押し上げているか、を知ることができますか?
私の心配(質問)は相関が一見強いとそれが原因だった、という結果が
それだけで出てしまいそうなことです。

なにかいい方法があったら教えてください。

Aベストアンサー

相関係数は変数間の線形関係を図るだけの尺度ですから、因果関係とか非線形の関係はわかりません。

一般的な方法
1.回帰分析
・因果関係がありそうな変数について、理論モデルを作る(仮説)

・統計的に実証できるようなモデルにする

データを集めてきて回帰分析して、パラメータの推定・検定をする

パラメータが有意だったらその仮説が間違ってはいないことになる。検定してダメだった場合は以下の場合がありうる
(1)変数の選択がダメな場合(理論が間違ってる)
(2)関数形が間違っている場合
(3)変数間に自己相関や不均一分散が認められる場合
(4)データが少なすぎる場合
(5)変数が共和分していない場合
(6)推計方法が間違っている場合
これらのどの場合にあてはまるかを機械的に判定する方法はありませんので、一つ一つ検討するしかありません。

2.時系列分析
・関係ありそうな変数を選び(あまり理論モデルにこだわらないでいい)、それらの変数およびそれらの変数の過去の値に基づく多変量自己回帰モデルを作る

モデルの次数などはAIC基準などで選ぶ

モデルのパラメータを推定・検定する

あとは1とだいたい同じ。なお、変数間の因果性検定(グレンジャーテスト)やインパルス応答関数、スペクトル解析といった方法を使うこともできます。ただしこれは理論的な因果関係というよりも、統計的に定義された因果関係を抽出するだけですが。
強いていえば、1は変数間の因果関係とか理屈を知りたい人向け。2は理屈も大事だけど将来の予測を当てたい人向け、ということになります。

相関係数は変数間の線形関係を図るだけの尺度ですから、因果関係とか非線形の関係はわかりません。

一般的な方法
1.回帰分析
・因果関係がありそうな変数について、理論モデルを作る(仮説)

・統計的に実証できるようなモデルにする

データを集めてきて回帰分析して、パラメータの推定・検定をする

パラメータが有意だったらその仮説が間違ってはいないことになる。検定してダメだった場合は以下の場合がありうる
(1)変数の選択がダメな場合(理論が間違ってる)
(2)関数形が間違って...続きを読む

Q回帰直線と相関係数

ある任意の回帰直線に対する相関係数の求め方をどなたか教えていただけないでしょうか。

EXCELでは近時曲線(直線)を書いて、その曲線に対する相関係数を算出していると思います。
また、切片を任意に変更することによって相関係数が変わっています。

説明不足でしたら、ご指摘いただけたら幸いです。

Aベストアンサー

No2です。

>エクセルでどのように回帰式を出しているのか?最小二乗法?
 回帰式は、通常、最小2乗法では出しません。YのXによる回帰です。回帰式から、データの点まで、垂線を引き、その距離が最小になるように計算します。
 したがって、XとYを逆にすると、微妙に違ってきます。統計学のテキストには、そのように書いてあります。

 この違いは、最小2乗法だと、XとYの値を逆にし回帰式を書いても、変形すれば同じになります。エクセルが、どのようにしているかは、確かめていません。

 回帰直線は、相関係数が高くなるように描きます。また、相関係数の計算式を見ていただければ、データのxとyの値だけで計算されます。すなわち、回帰式のaとbは、入っていません。ですから、勝手に回帰式を描いて、その相関係数は、というのは不可能です。
 相関係数の絶対値を最も高くなるように、回帰式を計算する、というのが手順です。回帰式を描いてから、相関係数を算出することは、できません。
 もちろん、勝手に回帰式を描くのは、自由です。が、その根拠を示すのが困難です。

 No2で、エクセルでは、回帰式を描けば、相関係数は自動的に、と書き込んだのは、エクセルの手順がそのようになっているからです。

>実際のデータはばらつきをもっているため、私の知識では、そのような関係の相関?回帰?線が、つくれまん。

エクセルで、回帰式を求めたご経験があってのことなら、最小2乗法による回帰式のプログラムがあればOKでしょうが、知りません。
 エクセルが、最小2乗法を用いているかどうかは、先に述べたように、確認していません。高次式の相関係数も算出しているので、最小2乗法かもしれません。

>そこでAの傾きをもった回帰?相関?線を条件として
Aの値は、理論的に決められるのですか。そうでないのなら、データから素直に相関分析をして、回帰式を決定するのが科学的です。
 それから、数値は、対数に変換した方が、相関係数が高くなる場合が珍しくありません。対数回帰、べき乗回帰などになります。高次回帰は、解釈が難しいので、好きにはなれません。最も相関が高くなる回帰式を選ぶのが原則です。

No2です。

>エクセルでどのように回帰式を出しているのか?最小二乗法?
 回帰式は、通常、最小2乗法では出しません。YのXによる回帰です。回帰式から、データの点まで、垂線を引き、その距離が最小になるように計算します。
 したがって、XとYを逆にすると、微妙に違ってきます。統計学のテキストには、そのように書いてあります。

 この違いは、最小2乗法だと、XとYの値を逆にし回帰式を書いても、変形すれば同じになります。エクセルが、どのようにしているかは、確かめていません。

 回帰直線...続きを読む

Q近似直線の傾き同士の相関

初めて質問させていただきます。

早速ですが、EXCELで近似直線を書くことができますが、この傾きと他の変数の近似直線の傾きの相関分析を行うことはルール違反なのでしょうか。

より具体的に申しますと、たとえば1980年から2000年までのGDPと大学入学率のデータを持っていた場合に、EXCELで1980年から2000年までのそれぞれの動きをプロットした上で、近似直線を引き、その傾き同士を相関分析によって比較すると言うものです。

おそらく本来であれば、平均成長率の比較をする場面だと思います。平均成長率の比較でうまくいかなかったために苦肉の策として思いついたのですが、このような方法の相関分析を行っている研究を見つけることができません。

どなたかご存知の方がいらっしゃいましたら、日本語、英語の論文で類似の相関分析を行っている研究がもしあるならば教えていただけると幸いです。

よろしくお願いします。

Aベストアンサー

実際の数値をいじったことがないので、統計一般論で
議論に間違いがない(統計以外の手段で、GDPと大学入学率のデータの相関があるという論法が存在すること)として
傾きを求めたことで、自由度が2-3くらい(正確な数値を忘却)減少しています。
すると、データ数20戸だから、自由度が15とか、13とかの検定になります。有意を取れますか。

この自由度の低下の問題を嫌って、生のデータ同士を比較するのが普通です。

もうひとつの問題は、「独立している」という条件です。
Aという値がBとCの値から計算できる場合(Aは、B又はCに対して従属)に、BとCを比較すると、従属になります。これは、代数の問題ですので、数式を解くだけで求められます。
つまり、演算方法によっては、「必ず有意になる」場合や、必ず「有意ではない」となる場合があります。この問題を避けるために、層間係数を求める場合には、独立であること、という条件をつけます。

私が計算すると必ず計算間違いをするのでしませんが、分散分析表を書いてみて、どこに度のような誤差が蓄積するのかを求めてください。
層間係数を求める場合の分散分析表の書き方は、多分統計の本に載っていると思います。事前に行った演算についても、同様に考えてください。

今時の統計の助手以上の人ならば、分散分析表ぐらいは書けるでしょうから、回答の意味がわからなければ、学校の先生に聞いてください。
そのほうが、マンツーマンで教えてもらえるので、ときとぎきけ胃酸間違いなと゛をする私の内容よりは正確でしょう。

実際の数値をいじったことがないので、統計一般論で
議論に間違いがない(統計以外の手段で、GDPと大学入学率のデータの相関があるという論法が存在すること)として
傾きを求めたことで、自由度が2-3くらい(正確な数値を忘却)減少しています。
すると、データ数20戸だから、自由度が15とか、13とかの検定になります。有意を取れますか。

この自由度の低下の問題を嫌って、生のデータ同士を比較するのが普通です。

もうひとつの問題は、「独立している」という条件です。
Aという値がBとCの値から計算で...続きを読む

Q数学のデータの分析について質問です。 あるデータの変量x,yの相関係数をrとしたとき、変量x全てに1

数学のデータの分析について質問です。
あるデータの変量x,yの相関係数をrとしたとき、変量x全てに10倍して求めた相関係数はrとは違う値になりますか?また、変量x全てに10ずつ足して求めた相関係数もrとは違う値になりますか?どちらかが変わらないと聞いたことがある気がするんですが…。教えてください。

Aベストアンサー

No.1です。失礼しました、間違えていました。

「変量x全てに10ずつ足した場合」も、
  x - E(x)
の値は変わらないので、「x の標準偏差」「x, y の共分散」とも不変で、相関係数は変わりませんね。

Q「正常資本係数」って何?

当方国外で経済学を習得した為、今、経済学の勉強をしていて日本語の専門用語が解らなくて困ってます。教えて下さい。

質問したいのは、以下の経済学の演習問題についてです。
→問:封鎖経済でGは存在しないとする。民間貯蓄率が20%、正常資本係数が3であると仮定して以下の問に答えなさい。

(1)「正常資本係数」って何なんでしょう?
また、それはどういった法則・考え方で使われているのでしょうか?(例えば、投資関数の中で減価償却と新規投資の関係を示す係数である、とか)そして、「正常資本係数:3」が意味する所が何なのかを教えて下さい。

宜しくお願いします。

Aベストアンサー

経済成長の話ですか?

正常資本係数というのは分かりませんが、資本係数といったら、capital-output ratio のことですよね。経済成長で出てくる k=K/Y の kです。(Kは資本ストック、Yは産出量)詳しくはマクロの教科書の成長の章でも見てください。ローマ-の1章とか。

Googleで正常資本係数で検索したら、1件しかヒットしませんでした(リンク参照)。(資本係数は山ほどヒットする。)あまり一般に使われている用語ではないのかもしれません。そこをみると、経済成長の資本係数と関係あるようですが、きちんとした意味はよくわかりません。

あまりちゃんとした回答になってませんが、ご参考まで。問題の出典や、前後の文脈をもう少し詳しく教えていただければ何か言えるかもしれませんが。

参考URL:http://www.mii.kurume-u.ac.jp/~matsuo/naiyou3.html


人気Q&Aランキング

おすすめ情報