dポイントプレゼントキャンペーン実施中!

相関係数と回帰直線ってなんですか?

ある資格の勉強をしているのですが、上の2つの用語の意味がよく分かりません。自分なりに調べたのですが、???な状態です。

どなたか、用語の意味を簡単に説明してください。
また、相関係数や回帰直線を調べることによって何が分かるのでしょうか?

ちなみに私は、統計学についてはド素人ですので、専門用語などはまったく分かりません。説明する際、専門用語の使用はできるだけ避けてください。お願いします。

A 回答 (3件)

回帰直線:


横軸を数学の点数、縦軸を国語の点数として、人数ぶんの点を打ってグラフとします。
このとき、無理にでも、両者の関係を示す直線を1本引きます。実は、この直線を自由に引けば何百本でも引けます。これらの無数の直線の中で「データを示す点と、この直線との<縦方向の距離>の2乗の合計が最も小さいようもの」をもって「代表」とします。これが回帰直線です。「2乗の合計が最小」ということから、この方法を「最小2乗法」といいます。

相関係数:
「数学のできる人は、国語もできる(またはできない)という関係があるのか」という「程度」を数値で示したものです。もし右上がりの直線にすべての点が乗るならば、「数学のできる人は必ず国語もできる」といえます。このとき相関係数が+1だ、といいます。また、(こんなことはめったにないが)右下がりの直線にすべての点が乗るならば、相関係数は-1だ(数学のできる人は必ず国語ができない)、といいます。あらゆるケースは、この区間のどこかに入ります。

相関係数の絶対値が1に近ければ「強い」相関といい、0に近ければ「弱い「相関といいます。一般には、この回帰直線と相関係数の間連性は密接ですが、判断には注意が必要です。例えば、データが、ある2次曲線にピッタリ乗るとき、強い相関があるのに、回帰「直線」は平らになり、相関係数はゼロだったりします。
    • good
    • 0
この回答へのお礼

ありがとうございます。
多分ですが(^ ^)、理解することができたように思います。

お礼日時:2010/07/06 19:44

こんにちは。

素人さん向けの解説なので、私の出番ですね。

たとえば、全データの平均値が100だとすると
・102 は +2 だけ外れている
・98 は -2 だけ外れている
ということになりますよね。
こういうやり方をしてしまうと、全データの外れ具合の合計はゼロになってしまいます。
当然ですよね?
そのため、「外れ具合の合計では外れ具合を表せない」ということになります。

しかし、
・102 は (+2)^2 = 4 だけ外れている
・98 は (-2)^2 = 4 だけ外れている
という考え方をすると、どうでしょう?
外れ具合の合計はプラスになります。
(マイナスには絶対ならない。奇跡的に全データがすべて同じ値の場合はゼロ。)
この考え方の誤差を「二乗誤差」と言います。

回帰直線というのは、二乗誤差の考え方で引かれた直線です。
全データそれぞれの、直線からの外れ具合(二乗誤差)の合計を最小にするのです。
一次関数 y=ax+b は中学校で習いますが、
外れ具合(二乗誤差)の合計が最小になるようにaとbを決めた一次関数こそが回帰直線です。
回帰直線は計算で求まるので、誰が引いても必ず同じ直線になります。
(というわけで、「回帰」のことを「最小二乗法」とも呼びます。)

次に、相関係数についてですが、
これは意外と、理系の人でも意味を知らない人は多いです。
誰から教えられることもなく私が編み出した説明方法は、こうです。

「(ゴム製のグラフ用紙に描かれた)グラフを縦か横に真っ直ぐ引き伸ばして、一次関数の傾きaを1(+45°に相当)または-1(-45°に相当)になるようにしたとき、その直線から各データの点の外れ具合が大きいのか小さいのかを表す数値が相関係数である。」

そして、

「相関係数は、-1から1までの数になる。
 1に近いほど、45°の相関が強く、-1に近いほど、-45°の相関が強く、そして、ゼロに近いほど相関が小さい。」

ということです。
なぜ45という角度が出てくるか、ですが、
たとえば、角度が10°~20°しかないようなグラフや80°もあるようなグラフにしてしまうと、各データの点が直線に近く見えちゃうからです。


>>>また、相関係数や回帰直線を調べることによって何が分かるのでしょうか?

「何がわかるか」は、以上の説明で終わりなのですが、
たとえば、毎日の自宅勉強時間数とテストの成績の関係のグラフを作ったとしましょう。
折れ線グラフにしたら馬鹿です。
直線を引くにしても、見た目で引くのでは、引く人によって違う直線になってしまいます。
回帰直線を引くのが合理的です。
客観性のある引き方なので、信用できます。

そして、相関係数rを求めると、
r>0.5  勉強すればするほど成績がよくなる
-0.2<r<0.2  勉強時間と成績は関係ない
r<-0.5  勉強すればするほど成績は悪くなる
ここで、0.5などの数字は、私の経験による「勘」です。
一般的には、相関の度合いはもっと厳しい基準で考えるものとされていますが、実際使いこなしてみると、もっとゆるくしてもよい、むしろ、もっとゆるくすべきであることが、私の経験上わかっています。

また、工業において、ある一つの製品の製造工程の数が100以上になると、
単にデータをながめているだけでは、不良率に何の工程の何の値がいちばん関係しているかはわかりません。
ところが、相関係数を調べると、何の工程の何の装置・何の値が関係しているかが、たちどころにわかります。
そういう分析をするかしないかで、利益に億単位の差がついたりします。

では、この辺で。
    • good
    • 0
この回答へのお礼

ありがとうございました。
よくわかりました。

お礼日時:2010/07/06 19:51

まず、


あなたの勉強している(取得しようとしている)資格は何ですか?
その勉強のために使用している参考書や問題集に解説が出ていませんか?
どのようなところに『相関係数』や『回帰直線』が出ていますか?
たとえば、経済学のところで『7月の気温』と『アイスクリームの売上高』の関係とか…。
気温が1度上がると売上げが10%増加するとか。
統計学が必要だと考えられるのなら、最低限、その資格に必要なところを勉強することですね。
あなたのレベルを知っている、その資格に応じた説明が出ている解説がいちばんですね。
資格取得に向けて頑張ってください。
答えになってませんが、ここで質問しても満足する回答は難しいのでは?
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!