アプリ版:「スタンプのみでお礼する」機能のリリースについて

数学Iのデータの範囲について質問です。
共分散のことなのですが、xy座標上でイメージをつかむことはできますか?
分かりにくい質問で申し訳ありません。
例えばxの標準偏差なら、「x軸上でこれほどの程度でxについての変量が散らばっている」とイメージすることができるのですが、共分散がどのようなことになるのかがよく分かりません。
そもそも平面のイメージで考えることではないのかもしれませんが、もし分かりやすいヒントがあれば教えていただきたいです。

A 回答 (1件)

企業で統計を担当する者です。



講義では「相関」「相関係数」という言葉も出てきたと思います。
生データは平均を引いて中心化してあるとします。

・生データで各データの対の積和をとったものが共分散
(正確にはデータ数で割りますが)
・生データのx軸、y軸の標準偏差σを計算して、
あらかじめ(x-xbar)/σという基準化を行い、
その後、各データの対の積和をとったものが相関
・あるいは、データの対の積和を
それぞれの分散の平方根で基準化したものが相関

つまり、共分散は、相関の仲間なのです。
x軸y軸の平面上で各データが
弓道の的のように分布しているときは共分散や相関が小さく、
ラグビーボールのように楕円になっているときは共分散や相関が大きいのです。

また、

・元データの行・列を入れ替えてx・y軸の各データを
n次元のベクトル要素とみると(イメージしにくいですが)、
要素の積和は内積になりますから、
共分散が小さければ、x軸とy軸は直交に近く、
(もちろん共分散が0なら直交)
共分散が大きければ、x軸とy軸は同じ方向を向くようになります。

後半は、数学の先生でも理解できないかもしれませんので、
先生の前で言わない方が良いです。
データ数がnセットあると、n次元の空間の話になりますから。

でも、後半のことを知っていると、
相関をもっているためにラグビーボール状に潰れているデータ空間に
分散共分散行列の逆行列(XTX)^-1(X転置Xのインバース)を掛けてやると、
直交する空間に写像できることが理解できます。

これが、大学(理系)で学ぶ線形代数学や統計学につながっていくのです。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!