プロが教える店舗&オフィスのセキュリティ対策術

分散はなぜ平均からの差の2乗を用いるのでしょうか?
偏りを表すのなら、差の絶対値の平均でもよさそうです。

2乗になにか数学的な意味があるのでしょうか?

A 回答 (3件)

「差の絶対値の平均」ももちろんあって, 実際「平均偏差」という名前もちゃんとついています. ただし, 絶対値というのは微積分と相性が悪いので使い勝手がよくないです.



あと, 「差の 2乗」であれば「平均からの差」を考えることに理論的な根拠があるんだけど, 「差の絶対値」だと実は「平均からの差」を使う根拠がなかったりする.
    • good
    • 0

>偏りを表すのなら、差の絶対値の平均でもよさそうです。



そうですね。
「差の平均」では「ゼロ」になってしまうので、最低でも「必ず正の値」にして平均しないと「平均からの離れ具合」の指標にはなりませんね。その意味で「絶対値」を使うのも一つの方法です。

与えられた数値群を処理して、「平均からのばらつき具合」を示す定量的なパラメータを何か設定するだけなら、「絶対値」でもよいのです。

>2乗になにか数学的な意味があるのでしょうか?

上に書いた「平均からのばらつき具合」をパラメータとして、その「確率分布」として考え、何らかの分布関数で表わせると統一的な処理ができますね。
多数のランダムなデータは、平均値の周りに「正規分布」します。これは「数学的な人為操作」というよりも、「自然界がそうなっている」という経験則です。
その正規分布の「確率分布」を表わす関数(確率密度関数)は

 f(x) = [ 1/√(2パイσ²) ]e^[ -(x - μ)² /2σ² ]

です。μ が平均ですから、「平均との偏差の2乗」の関数ですね。その分母の「σ²」は分散、「σ」は標準偏差です。

「標準正規分布」として
 x - μ = X
 σ = 1
とすれば
 f(X) = [ 1/√(2パイ) ]e^[ -X² /2 ]
となります。

「2乗の数学的な意味」はこれで分かりますね?

この「正規分布」を使うことで、単なる「得られたデータの特性の記述」(記述統計)だけでなく、得られたデータからいろいろなことを「予測・推定・判定」することができるようになります(推測統計)。この「推測統計」が、統計学の「力の見せ所」であり、世の中で発生するデータのほとんどは「ランダム・偶然」で「正規分布」に従います。
ということで、得られたデータを「とりあえず正規分布とみなして処理する」というのが「平均」「分散・標準偏差」を求める理由です。
    • good
    • 0

>>差の絶対値の平均でもよさそうです。


そうです、良いのです。
が、絶対値は概念で有って、パッと計算出来ない。
だから2乗和を平方根で開いてます。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!