電子書籍の厳選無料作品が豊富!

数学の「共分散」について

共分散の意味はわかるのですが

共分散の値が大きい時と小さい時(3と2など)

とでは何が違うのでしょう?

A 回答 (5件)

共分散は「分散」ですので、元のデータによって値はいろいろです。



同じ試験の満点の付け方を100点満点にするか10点満点にするかで、「分散」は100倍の違いになります)。
分散の平方根が「標準偏差」です。
分散ですから、値が大きいほど「分布のばらつきが大きい」ということを示します。

「共分散」は、単純な1つのパラメータの分散ではなく、2つのパラメータ、例えば「数学」の点数と「英語」の点数のばらつき方の関係を示すものです。
このとき
(a) 数学ができる人は英語もできる
(b) 数学ができない人は英語もできない
という人が多い場合には、「共分散」は「正の値」になり、かつ「数学も英語も高得点」「数学も英語も低得点」という人が多いほど「大きい正の値」になります。つまり「数学と英語の点数には大きな関係がある」ことを示します。

一方、
(c) 数学ができるからといって、英語もできるわけではない。
(d) 英語ができるからといって、数学もできるわけではない。
という「数学と英語はの点数はほとんど関係ない」という場合には、「共分散」は「0 に近い値」になります。つまり「数学と英語の点数にはあまり関係がない」ことを示します。

さらには、
(e) 数学ができる人は、英語ができない。
(d) 英語ができる人は、数学ができない。
という「数学と英語の点数は相反する」という場合には、「共分散」は「負の値」になります。つまり「数学と英語の点数には逆の関係がある」ことを示します。

「共分散」とは、そういうパラメータです。
「絶対値が大きいほど、その傾向が大きい」ということです。(「正の値」のときは値が大きいほど、「負の値」のときには値が小さいほど)
    • good
    • 0

共分散の値そのものに意味を見つけるのは難しいでしょう。


共分散は、相関係数を算出するための途中計算と思えばいいのでは?
相関係数の意味は、No.4 に詳しく説明されているとおりです。
相関係数は -1 から 1 の実数値をとり、
1 に近いほど両変数の関係は傾き正の一次関数に近く、
-1 に近いほど両変数の関係は傾き負の一次関数に近くなります。
0 に近ければ、あまり一次関数でもないということです。

ここで仮に、各変量の { (値) - (平均) }/√(サンプル数) を並べた
ベクトルを「偏差ベクトル」と呼ぶことにすると、
偏差ベクトルの内積が共分散、
偏差ベクトルの方向余弦(なす角のcos)が相関係数です。

偏差ベクトルが { (値) - (平均) }/(サンプル数) なら
まだしも共分散に現象論的な意味を見出しやすいかもしれませんが、
そうなっていませんからねえ...
定義式が分散と似ていてシンプルなことが
共分散の存在意義、だれもが経由する途中式になる理由でしょう。
    • good
    • 0

#3です。



元データを基準化してから共分散を計算すると、それが相関係数になります。

相関係数は、横軸も縦軸も1に基準化された状態の共分散です。近似線の傾きは常に45°かー45°で、データ空間が扁平になって、その線に近づけば近づくほど相関係数は大きくなり1かー1に近づきます。

つまり、同じく扁平度合いということです。
「数学の「共分散」について 共分散の意味は」の回答画像4
    • good
    • 0

定性的な説明で申し訳ありませんが、添付図のようになります。



共変量Sxyの式は平均μを原点(0,0)だと考えると、各項がxy、いわば反比例の式で、各x,yの組は双曲線上の点である、と考えることができます。

それらの和が正側に大きいということは、第1第3象限では、原点から遠ざかるように、第2第4象限では、原点に近づくように、データ空間を形成しているということになります。

それを定性的に図にしてみると、共分散が大きいときは、データ空間が赤い線で囲まれたように扁平になっていると言えます。

もちろん、#2さんが書かれているように、x分散y分散を基準として考える必要がありますが、共分散の大小が何を意味するかと言ったら、データ空間の扁平度合いです。
「数学の「共分散」について 共分散の意味は」の回答画像3
    • good
    • 0

「分散の (絶対) 値の大きさ」そのものが意味を持つ文脈はあんまりないと思う.



相関係数ならまだしも.
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!