相関係数を使って相関関係の有り無しを判断するのに、基礎統計の本によってその基準はマチマチです。ある本によればr=0.5なら弱いながらも相関はあるとの判断基準でした。ところがある人の話では実務上「相関関係あり」と判断するのは、R^2>=0.5のときなのだそうです。これを単相関係数に直せばr>=0.7ですから上記内容とはかなり数値の乖離があるように思います。絶対的な正解はないと思いますが、このことについてどのような判断をするのが一番妥当なのでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (2件)

サンプル(x,y)の個数が10個でR=0.5というのと、サンプル数10000個でR=0.5というのでは、全然話が違いますよね。

Rの値にどのぐらいの誤差があるかをチェックするのが検定です。最も簡単なのは、「ホントはR=0のものが、ランダムなばらつきのせいで偶然R=0.5に見えているという可能性の確率」を計算する検定。(Happy_Hackさんが仰ってるのはこのへんの話です。)

さて、サンプル数が十分多くて、それでもR=0.5だとします。あるいはR=0.7でもいいや。ともかくRの値はかなり正確であるとする。
その値がどういう意味を持つのかをご質問になっているんだと思いますが、これは、仰るとおり「絶対的な正解はない」。相関をどう利用したいのかに依るんですよ。

 大抵の応用は:「xを見ただけで、yを推定したい。」というもの。
 この意味では大抵、R=0.7程度では全然使い物になりません。R=0.95から先がやっと使える感じ。R=0.5なんて無相関と言い切ってしまいたい位のものです。R=0.5の散布図を見てご覧なさい。R=0の場合と幾らも違わない。それで推定したyはほとんどでたらめに近いんですよ。
 それでも「yをごくおおざっぱに知りたい。」という応用もないとは限らない。これだったらR=0.7程度でも無意味とまでは言えない。
 さらに、「個々の推定値がまるで間違っていても良いから、統計的に多少とも良い推定であれば可。」たとえば賭を繰り返す場合の有利な張り方の研究、みたいなもの。そういう時には、0.5でも0.05でも平均して勝率が少しでも上がるんだから、意味があるでしょう。

 なお、「xはyに多少とも影響を与えているのか?」という問いに答えるのが目的なら、「ホントはR=0のものが、ランダムなばらつきのせいで偶然R=0.5に見えているという可能性の確率」こそが極めて重要ですよね。相関係数そのものは、ついでに出してみましたみたいなもの。どうだって良い。
 同様に、「x,yのどっちが、zに対してより大きい影響を与えているのか」という場合、しかしそればかりかxとyの間にも相関がありうるので、多変量解析(因子分析)として扱うべきですね。その一部として相関係数が現れます。それだけ。
    • good
    • 0
この回答へのお礼

非常に分かり易い説明を有難うございました。
恥ずかしながら私、統計に関してはド素人です。今回の質問はキチンと筋道を立てて勉強すれば理解できるはずのことでしたが実務家の性で、手っ取り早く「実」を取りたかったのです。その意味におきまして質問に対し的確に応えて頂いたことに感謝します。しかしHappy_Hackさんも仰るように「有意性」について知っておかないと、どうやらその「実務」自体に支障がありそうですね。t検定を勉強します。

お礼日時:2001/07/12 10:42

t検定を勉強しましょう


そうすれば、「有意性」について分るようになります。

お勧めは 松原望 著の
『わかりやすい統計学』丸善 です。

東大生のほとんどの人は
彼の統計学を1年次に学びます。
    • good
    • 1
この回答へのお礼

レス有難うございました。
ご推奨のありました本については早速、購入したいと思います。

お礼日時:2001/07/12 10:41

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QSPSSにて相関係数rを出したのですが、評価の仕方がわからない。

かなり基本的な質問で申し訳ないのですが、
相関係数rについて教えて頂きたいです。

ヒトの体重(kg)とエンゲル係数をデータとして、
統計ソフトSPSSに入力し、相関係数rを出力しました。
すると、r=0.56とでました。
相関係数rは1に近ければ近いほど相関が高いことくらいしかわかりません。
相関係数r=0.56の場合、相関があるといってよいのでしょうか?
評価方法が初学者にも勉強できる本などあれば、教えて頂けますでしょうか?
どうぞ宜しくお願い致します。

Aベストアンサー

 まず、散布図を描きます。直線が描けそうなら直線の回帰。社会現象だと、直線より、データーを対数変換したら直線になるとしいう対数回帰などもあるので、とにかく散布図をじっくりながめる。
 実際には、エクセルを使い、散布図を描きます。
 散布図から、最適の回帰式を選び、そのその式と相関係数を散布図上に表示します。
 
そして、その関係が有意か否かの検定をします。これは、自由度(=データー数 - 2)と相関係数からt検定を行うようです。初心者の私には、原理は理解できませんが、ちょっとした本なら、巻末に、その表がありますので、それを見ています。

 相関については、相関係数が0.7以上だと、強い正の相関、という表現をするようです。

>相関係数r=0.56の場合、相関があるといってよいのでしょうか?
上に述べたように、データ数によります。
 自由度11(データー数13)以上なら、危険率5%で有意差あり、すなわち、相関がある、と主張できます。
 
 次に因果関係の判定には、時間性、密接性、特異性、普遍性、合理性の5要件をすべて満たさないと、擬相関かもしれません。この5要件は、7要件、9要件とする説もあるし、名称も異なったりします。また、その意味もわかったような気になりますが、実際にはどうしてよいやら、ですので勉強する必要があります。たとえば、普遍性については、一致性の名称で、これまでの事例に反しないこと(一致すること、などの判定には何の役にもたたない説明も見ます)、なんぞの説明かあったりします。これまでの事例に話ないとは、具体的にどうなのか、どうやれば判定できるのかは、その説明からは無理だと思います。
 ただ、合理性だけは、これは経験のみ。他は、なんとか判定できるように説明できますので、判定に困ったら書きこんで下さい。

 それから決定係数も、勉強して下さい。相関係数より、意味がありますが、何故については、数式がよくわからないので理解できていません。

 まず、散布図を描きます。直線が描けそうなら直線の回帰。社会現象だと、直線より、データーを対数変換したら直線になるとしいう対数回帰などもあるので、とにかく散布図をじっくりながめる。
 実際には、エクセルを使い、散布図を描きます。
 散布図から、最適の回帰式を選び、そのその式と相関係数を散布図上に表示します。
 
そして、その関係が有意か否かの検定をします。これは、自由度(=データー数 - 2)と相関係数からt検定を行うようです。初心者の私には、原理は理解できませんが、ちょっとし...続きを読む

Q相関分析の相関係数と重回帰分析の偏回帰係数の違いの説明

実は会社での説明に苦慮しています。
例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。
どなたかお知恵をいただきたく、よろしくお願いします。

Aベストアンサー

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チームの防御率をX1、チームの打率をx2、すなわち、説明変数を複数(2つ以上)採り、順位yの推定を行うのが、重回帰分析です。
 このように、単回帰分析よりも、重回帰分析の方が、必ず相関係数が高くなります。すなわち、結果の推定の確実性が増すわけです。相関係数が、1.0になれば、説明変数の事柄だけで、従属変数の事柄が決定できます。すなわち、100%的中します。

 単回帰では、防御率、打率とも、相互の影響は考慮されていません。従って、防御率と打率のどちらが影響力が強いのかは、相関係数から予測はできるものの、決定できません。選手をとる場合、同じ年俸を払うのに、ピッチャーとバッターのどちらを補強したら効果的かは、判断が困難です。
 このとき、どちらの影響が強いかを推定できるのが、重回帰分析です。そのために利用するのが、偏回帰係数ですが、変数の単位に左右されるので、注意を要するところです。

 「単回帰では、(1)(2)(3)のどれが最も効果的かは、判断できません」が答えでしょうか。
 釈迦に説法の点は、ご容赦を。
  

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チー...続きを読む

Q相関係数が1になるのはなぜ

データ群Aとデータ群Bの相関係数を調べようとしています。
データ群Aはy=x
データ群Bはy=2x-5
0<=x<=10

このデータ群の相関係数を
共分散/(√Aの分散×√Bの分散)
で計算すると相関係数が1となります。

明らかにデータ群AとBが違っているのに相関係数が1になるのはなぜなのか、また、このデータ群の相関係数の正しい求め方を教えてください。
よろしくお願いします。

Aベストアンサー

リンク先あたりを読むと良いかもです。簡単に言えば「どのくらい比例関係(線形従属の関係)に近いか」を示す指標のようなものなので、比例していれば1(または-1)になります。

y=ax+bで、
xの平均値をpとすれば、yの平均値はap+bですからyの分散は
√Σ(a(Xn)+b-(ap-b))^2
=√Σ(a(Xn-ap))^2
=√Σ(a・(Xn-p))^2
=a・(√Σ(Xn-p)^2)

一方、xのほうはというと
√Σ(Xn-p)^2
なんで、両者を掛け算すると、
a・(√(Σ(Xn-p)^2)^2)
=a・(Σ(Xn-p)^2)

で、分子を見ると、
Σ(xn-p)(a(Xn)+b-(ap-b))
=Σ(xn-p)(a・(xn-p))
=a・(Σ(xn-p)^2)

なーんだ、一緒ジャン・・・とな

参考URL:http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0

Q集合論に強い方、R^2=平面、R^1=直線、R^0=原点?、またR^φやφ^φの意味?

集合論に強い方、お願いいたします。
Rは実数として、

R^2=平面、R^1=直線、R^0=原点

と思いますが、どのように意味づけされるかというと、
R^2={(x,y)|x∈R,y∈R}
だと、R^0がうまく説明できないので、
R^2={f|f:2点集合{x,y}→R 写像}
とすればうまくいきそうですが、
それで
R^0=原点
というのがうまく説明できるでしょうか?

また、
R^φやφ^φ
の意味付けをご存知の方は教えていただけ無いでしょうか。

Aベストアンサー

> R^2=平面、R^1=直線、R^0=原点

「原点」ではなく,ただ「点」ですね(R^1 が「x軸」ではないように)。

A^Φ={Φ} です。Φ ではありません。
Φ^Φも{Φ} です。0^0=1 肯定派の論拠の1つです。

Q相関係数って

今、大学の卒論で色々な相関係数を使って研究しようと思いますが、正直あまりよくわかりません。
なので、相関係数について、誰でもわかるように、また、卒論で載せれるような、詳しいことなどみなさまの理解している相関係数について教えてください。
よろしくお願いします。

Aベストアンサー

相関係数は似ているかどうかよりも、関連が有るかどうかを調べるものですね。

No.2さんが一般的な相関係数を列挙されていますが、それ以外にも偏相関係数というのがあります。これは、ある変数Aと変数Bに関連があるという結果が出た時に、じつはそれは他の変数Xの影響で関連があるだけだった。ということがあります。偏相関係数ではこのようなほかの変数(ここではX)の効果を取り除いた時の関連性を求めるものになります。

また、以前の回答と上記の偏相関係数も基本的には線形な関連性を求めるだけになります。この相関係数では、非常に単純な2次関数で表現できるような関連を相関係数で計算するとほぼ0(無相関)という結果になり、関係性を取り出すことが出来ません。
このような場合の相関係数にカルホーン相関というものがあります。

卒業論文で多少目新しいのもを行いたいならカルホーン相関なんか面白いかもしれませんね。

Q相関係数と決定係数

素人質問で恐縮ですが相関係数と決定係数の違いを教えてください。
相関係数を2乗すると決定係数になるというのは分かるのですが、それぞれの指標をどのように見ればいいのかわかりません。大変恐縮ですがよろしくお願いいたします。

Aベストアンサー

以下のURLは参考になるかと思います。

http://www.geisya.or.jp/~mwm48961/statistics/coef_det1.htm

疑問点が解決すればいいのですが。

Q回帰直線と相関係数

ある任意の回帰直線に対する相関係数の求め方をどなたか教えていただけないでしょうか。

EXCELでは近時曲線(直線)を書いて、その曲線に対する相関係数を算出していると思います。
また、切片を任意に変更することによって相関係数が変わっています。

説明不足でしたら、ご指摘いただけたら幸いです。

Aベストアンサー

No2です。

>エクセルでどのように回帰式を出しているのか?最小二乗法?
 回帰式は、通常、最小2乗法では出しません。YのXによる回帰です。回帰式から、データの点まで、垂線を引き、その距離が最小になるように計算します。
 したがって、XとYを逆にすると、微妙に違ってきます。統計学のテキストには、そのように書いてあります。

 この違いは、最小2乗法だと、XとYの値を逆にし回帰式を書いても、変形すれば同じになります。エクセルが、どのようにしているかは、確かめていません。

 回帰直線は、相関係数が高くなるように描きます。また、相関係数の計算式を見ていただければ、データのxとyの値だけで計算されます。すなわち、回帰式のaとbは、入っていません。ですから、勝手に回帰式を描いて、その相関係数は、というのは不可能です。
 相関係数の絶対値を最も高くなるように、回帰式を計算する、というのが手順です。回帰式を描いてから、相関係数を算出することは、できません。
 もちろん、勝手に回帰式を描くのは、自由です。が、その根拠を示すのが困難です。

 No2で、エクセルでは、回帰式を描けば、相関係数は自動的に、と書き込んだのは、エクセルの手順がそのようになっているからです。

>実際のデータはばらつきをもっているため、私の知識では、そのような関係の相関?回帰?線が、つくれまん。

エクセルで、回帰式を求めたご経験があってのことなら、最小2乗法による回帰式のプログラムがあればOKでしょうが、知りません。
 エクセルが、最小2乗法を用いているかどうかは、先に述べたように、確認していません。高次式の相関係数も算出しているので、最小2乗法かもしれません。

>そこでAの傾きをもった回帰?相関?線を条件として
Aの値は、理論的に決められるのですか。そうでないのなら、データから素直に相関分析をして、回帰式を決定するのが科学的です。
 それから、数値は、対数に変換した方が、相関係数が高くなる場合が珍しくありません。対数回帰、べき乗回帰などになります。高次回帰は、解釈が難しいので、好きにはなれません。最も相関が高くなる回帰式を選ぶのが原則です。

No2です。

>エクセルでどのように回帰式を出しているのか?最小二乗法?
 回帰式は、通常、最小2乗法では出しません。YのXによる回帰です。回帰式から、データの点まで、垂線を引き、その距離が最小になるように計算します。
 したがって、XとYを逆にすると、微妙に違ってきます。統計学のテキストには、そのように書いてあります。

 この違いは、最小2乗法だと、XとYの値を逆にし回帰式を書いても、変形すれば同じになります。エクセルが、どのようにしているかは、確かめていません。

 回帰直線...続きを読む

Q相関係数式のRの2乗ってなんですか?

質問が変ですみません。
最小二乗法で求めたと思われる式 
Y=0.306×(X)+2.295
p<0.005
R^2=0.946

という式と直線グラフがあります。
この式においてR^2は何を表しているのでしょうか?
相関係数の2乗ですか?(グラフを見る限りそこまで直線上にのっていないのですが・・・ ←相関がある=直線上に乗っているとは、また別な気もしますが、ここらへんもよくわかりません)

またそうだとすると、相関係数ではなく2乗を求めている理由も教えてください。

Aベストアンサー

#1です。サンプルと回帰直線との残差の二乗平均です。言葉足らずでした(^_^;)

Q数学のデータの分析について質問です。 あるデータの変量x,yの相関係数をrとしたとき、変量x全てに1

数学のデータの分析について質問です。
あるデータの変量x,yの相関係数をrとしたとき、変量x全てに10倍して求めた相関係数はrとは違う値になりますか?また、変量x全てに10ずつ足して求めた相関係数もrとは違う値になりますか?どちらかが変わらないと聞いたことがある気がするんですが…。教えてください。

Aベストアンサー

No.1です。失礼しました、間違えていました。

「変量x全てに10ずつ足した場合」も、
  x - E(x)
の値は変わらないので、「x の標準偏差」「x, y の共分散」とも不変で、相関係数は変わりませんね。

Q(1/2) ^ x = 0.7 → x = ~

(1/2) ^ x = 0.7

という式を x = の形にしたいのですが、
どういう計算をすればいいのでしょうか?

回答よろしくお願いします。

Aベストアンサー

与式より
x=log[1/2]0.7=(log[10]0.7)/(log[10]1/2)
 =(log[10]7-log[10]10)/(log[10]1-log[10]2)
 ≒(0.8451-1)/(0-0.3010)
 =(-0.1549)÷(-0.3010)
 ≒0.5146


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング

おすすめ情報