
3変量の分散についての質問です.
例)一変量の分散
鉛筆の長さ
4cm
3cm
5cm
6cm
3cm
と,5つのサンプルがある場合,
その鉛筆の長さの分散は,
平均→(4+3+5+6+3)/5=4.2cm
標本分散→{(4-4.2)^2+(3-4.2)^2+(5-4.2)^2+(6-4.2)^2+(3-4.2)^2}/5=1.36
となります.
しかし,多変量の分散に対しての扱い方が判りません.
例)3変量の分散
あるサンプル郡の色のRGB値
R G B
1 3 4
2 5 6
3 4 4
2 2 2
4 4 4
上記のサンプルを一群として,このような他の郡(2郡,3郡)との比較を考えています.
この場合の分散は
(1)R,G,Bそれぞれの分散ベクトルの比較
(2)共分散行列を求め,どうにかして比較(どうにか,と言う部位が思いつきませんが・・)
どのような対応を取ればよいでしょうか?
No.2ベストアンサー
- 回答日時:
重心からの距離との提案ですが,少し追加があります.
単なるユークリッド距離ではなく,相関を考慮して求めた距離の2乗値のことを
マハラノビスの汎距離といいます.
マハラノビスの汎距離は,相関係数行列,分散共分散行列のいずれから求めても
その期待値は次元数と一致します.
個々の観測点のばらつき(重心に近いか遠いか)の指標にはなりますが,
群の平均は常に同じ(3次元なら3)になり,群間の比較にはなりません.
ですから,1群,2群,3群をプールしてマハラノビスの汎距離を求め,
群毎の平均で比較することが良いと思います.
次に,事例に上がっている「身長,体重」ですが,
群のばらつきをどうとらえるかと視点で,良いヒントがあると思います.
身長と体重にはもともと相関があって,関係線がが引かれます.
(個々の標本から関係線に下ろした垂線の長さの2乗和を最小にしたもので主成分線と言われます)
・群のばらつきとは,重心からの分布の楕円の大きさである
・群のばらつきとは,身長依存分を除いた肥満度である
前者は,マハラノビスの汎距離
後者は,垂線の長さ と考えることができます.
例えば,エクササイズの実施群/非実施群の違いを見るとき,前者では効果無しとなるでしょう.
エクササイズでは身長を変えることができないからです.
(同じ身長の者だけ集めて,2群に分ければよいですが,身長によって効果が違うのではないか
という点に関して疑義を生じます)
つまり,RGBの観測値の中には,もともとブライトネス(サイズファクター),
コントラスト(シェイプファクター)があって,それには身長体重のような
一定の関係があるとします.
それは,撮影対象物あるいは撮影環境や設定値に依存し,
撮像素子や変換器のばらつきではないので,除く必要があります.
もちろん,それらの前提を固定して測定すればいいのですが,
他のケースにおいて,効果が違うのではないかという疑義が生じるので,
いくつかの観測点をサンプリングしています.
すると,3次元空間内に横たわる一定の平面(身長,体重の3次元版)が形成され,
それに下ろした垂線の長さの2乗和がその群のばらつきであると考えることが
できます.
通常,誤差は正規分布をとりますが,
このような(距離^2)はχ2乗分布となります.
後者のばらつきは,相関係数行列の最小固有値に一致します.
このときは,全体をプールせず,各々求めればいいです.
ただ,最小固有値の固有ベクトルが平面の法線ベクトルを与えていますので
それが,群毎に著しく違うことが無いということを確認しておく必要はあると思います.
ありがとうございます!
http://gucchi24.hp.infoseek.co.jp/HANBETUEX.htm
上記のサイトを参考に行ってみました.
助かりました!!
No.1
- 回答日時:
3変量を3次元空間での距離とおく考えはどうでしょう。
1変量の分散は、直線上の各点とその重心点(平均点)の距離の2乗の平均です。
2変量の分散は、平面状の各点とその重心点の距離の2乗の平均。
同様に3変量の分散は、直行するR軸、G軸、B軸の空間に位置する各点とその重心点との距離の2乗の平均とする。
今回の例題のように、RGBが同じ性質(単位)の数値あれば、この考え方でよいと思います。
身長と体重のように、単位が異なると分散の意味があるのかどうか?
たとえば、「身長がほぼ同じで、体重がばらついている郡と、身長はばらついているが、体重はほぼ同じ郡を比較して、分散が同じだったら、ばらつきが同じとである」といっても意味がない。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 不偏分散を計算するときに標準偏差和をn-1で割りますが、なぜ-1なのでしょうか? 「なぜnでなくn- 5 2022/07/04 14:54
- 統計学 標本分散の求め方 1 2022/11/18 19:29
- 数学 【 数Ⅰ 分散 】 問題 20個の値からなるデータがあり, そのうちの8個の値の平均値は3,分散は4 4 2023/02/15 23:28
- 統計学 不偏分散について 3 2022/03/29 15:57
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 統計学 最近統計学について独学で勉強している者です。 mとnは二つの母集団から無作為抽出した際の標本のサイズ 2 2023/02/07 12:35
- 統計学 統計の問題について教えてください。 4 2023/04/27 18:02
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 数学 数学の問題です。 問1: ある(人数の非常に多い)集団から無作為に6名を選んで身長を測ったところ、そ 2 2022/12/09 12:03
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
主成分得点から変数の予測
-
確立の問題です
-
重荷分散の為に敷く板には木製...
-
この答えが4になるのですが、私...
-
3変量の分散についての質問です.
-
金融資産1億円以上持っている...
-
mgf関数
-
2つの正規分布を合成したらど...
-
体重分散用のベニヤ板って販売...
-
正規分布の加法性について
-
エクセルのF検定
-
数A データの分析の問です。 次...
-
期待値と分散について
-
標準偏差
-
正規分布に従わないと標準偏差...
-
工程能力のN数補正について
-
(1)で分散を求める時、解答では...
-
統計学でいうRSD%とは何ですか。
-
統計でいう「n」は、何の略な...
-
顔面偏差値100点満点中何点ぐら...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
重荷分散の為に敷く板には木製...
-
数学(ほぼ統計)について、教...
-
分散が大きいとデータの偏りが...
-
統計の分散のイメージ
-
2つの正規分布を合成したらど...
-
平均値と分散について質問させ...
-
ベルヌーイ分布における独立な...
-
以下の数学の問題を教えてくだ...
-
ネットワーク分散エンコーダを...
-
ランダム出力の数値をコントロ...
-
確率変数の商の分散
-
seo対策の為、IPアドレスを分散...
-
mgf関数
-
至急!!エクセルで度数分布表...
-
互いに独立な時の確率密度関数
-
1〜6の目が等しい確率で出るサ...
-
SETIみたいな
-
分解能と分散能
-
長期投資で年率7%で指数関数的...
-
幾何ブラウン運動
おすすめ情報