プロが教える店舗&オフィスのセキュリティ対策術

なぜデータの大きさ×分散=最小ということがわかるんですか?
そういうものとして覚えるしかないんでしょうか?

「なぜデータの大きさ×分散=最小ということ」の質問画像

A 回答 (4件)

分散の覚え方は2通り有って、


定義:V={Σ(x-X)²}/n

コンピュータ処理ではこれを計算する事はせずに定義を変形した式を使います。
定義をそのまま展開すると、

V={Σx²}/n + 2X{Σx}/n + {ΣX²}/n

ここで
{Σx}/n=X(平均の定義だから)
{ΣX²}/n=X²(X²をn個足してnで割るからX²)

∴V={Σx²}/n-X²

分散:x2乗の平均ー平均の2乗
こっちの方が便利なのです。
    • good
    • 0

No.2 です。

ああ、ごめん、ちょっと筆がすべった。

②の式は「1/2」は間違いで「1/n」です。
ここを訂正して後半を再掲します。

(以下、訂正して再掲)

ただし、
 (x^2)bar - (xbar)^2   ①
が「分散」と呼ばれる量であることは覚えておいた方がよいです。
「分散」は、別なところで定義を習ったと思いますが、「2乗偏差」の平均値です。
つまり「どれだけばらついているか」を示す量で、その「平方根」が「標準偏差」です。受験生御用達の「偏差値」の計算に使われるやつ。

分散の定義は
 V = (1/n)Σ(i=1~n)(xi - xbar)^2   ②      ←!!!ここを訂正!!!
です。各データと「平均値」との「偏差」の2乗(2乗偏差)の平均値です。単なる「偏差」を平均すると 0 になっちゃいますからね(マイナスの偏差もあるから)。必ずプラスになるように2乗しています。

②を変形すれば
 V = (1/n)Σ(i=1~n)(xi - xbar)^2
  = (1/n)Σ(i=1~n)[(xi)^2 - 2xi・xbar + (xbar)^2] ←2乗を展開した
  = (1/n)Σ(i=1~n)[(xi)^2] - (1/n)Σ(i=1~n)[2xi・xbar] + (1/n)Σ(i=1~n)[(xbar)^2] ←足し算を分割した

ここで
第1項:(1/n)Σ(i=1~n)[(xi)^2] は「2乗平均」そのものですね。つまり
  (1/n)Σ(i=1~n)[(xi)^2] = (x^2)bar
 と書ける。

第2項:(1/n)Σ(i=1~n)[2xi・xbar] は、「2xbar」は定数なので前に出せて
 (1/n)Σ(i=1~n)[2xi・xbar] = 2xbar(1/n)Σ(i=1~n)[xi]
 ここで、xi を全部足し合わせて個数 n で割ったものが「平均」
  xbar = (1/n)Σ(i=1~n)[xi]
 なので、この項は
  (1/n)Σ(i=1~n)[2xi・xbar] = 2(xbar)^2
 と書ける。

第3項:(1/n)Σ(i=1~n)[(xbar)^2] のうち「Σ(i=1~n)[(xbar)^2]は、定数「(xbar)^2」を n 回足すだけなので
 (1/n)Σ(i=1~n)[(xbar)^2] = (1/n)n(xbar)^2 = (xbar)^2

以上より、②は
 V = (x^2)bar - 2(xbar)^2 + (x^2)bar
  = (x^2)bar - (xbar)^2
となって、①になりますよね。

「覚える」というよりも、「当たり前にそうなる」ということで理解しておきましょう。
これは知っているといろいろと便利に使えますから。
    • good
    • 0

>なぜデータの大きさ×分散=最小ということがわかるんですか?



質問の趣旨がよく分かりません。

左の「本文」に書いてある「ゆえに、y は t=xbar のときに最小となる」というところまでは理解できているということでよいですね?
(注:テキスト文字では x の上に横バーを引くことができないので「bar」と言葉で書きます)
それは上に書いてある「二次関数」の平方完成から言える結論ですから。

そして、それが「最小」であるときの最小値は、平方完成の形から
 n[-(xbar)^2 + (x^2)bar]
であることが分かりますよね。

右の注記欄に書いてあるのは、単にその「事実」、式からわかることが書いてあるだけです。
まあ、「式からそう読み取れる」「この y の場合はそうだ」ということなので、特に覚えておくこともないと思います。

ただし、
 (x^2)bar - (xbar)^2   ①
が「分散」と呼ばれる量であることは覚えておいた方がよいです。
「分散」は、別なところで定義を習ったと思いますが、「2乗偏差」の平均値です。
つまり「どれだけばらついているか」を示す量で、その「平方根」が「標準偏差」です。受験生御用達の「偏差値」の計算に使われるやつ。

分散の定義は
 V = (1/2)Σ(i=1~n)(xi - xbar)^2   ②
です。各データと「平均値」との「偏差」の2乗(2乗偏差)の平均値です。単なる「偏差」を平均すると 0 になっちゃいますからね(マイナスの偏差もあるから)。必ずプラスになるように2乗しています。

②を変形すれば
 V = (1/n)Σ(i=1~n)(xi - xbar)^2
  = (1/n)Σ(i=1~n)[(xi)^2 - 2xi・xbar + (xbar)^2] ←2乗を展開した
  = (1/n)Σ(i=1~n)[(xi)^2] - (1/n)Σ(i=1~n)[2xi・xbar] + (1/n)Σ(i=1~n)[(xbar)^2] ←足し算を分割した

ここで
第1項:(1/n)Σ(i=1~n)[(xi)^2] は「2乗平均」そのものですね。つまり
  (1/n)Σ(i=1~n)[(xi)^2] = (x^2)bar
 と書ける。

第2項:(1/n)Σ(i=1~n)[2xi・xbar] は、「2xbar」は定数なので前に出せて
 (1/n)Σ(i=1~n)[2xi・xbar] = 2xbar(1/n)Σ(i=1~n)[xi]
 ここで、xi を全部足し合わせて個数 n で割ったものが「平均」
  xbar = (1/n)Σ(i=1~n)[xi]
 なので、この項は
  (1/n)Σ(i=1~n)[2xi・xbar] = 2(xbar)^2
 と書ける。

第3項:(1/n)Σ(i=1~n)[(xbar)^2] のうち「Σ(i=1~n)[(xbar)^2]は、定数「(xbar)^2」を n 回足すだけなので
 (1/n)Σ(i=1~n)[(xbar)^2] = (1/n)n(xbar)^2 = (xbar)^2

以上より、②は
 V = (x^2)bar - 2(xbar)^2 + (x^2)bar
  = (x^2)bar - (xbar)^2
となって、①になりますよね。

「覚える」というよりも、「当たり前にそうなる」ということで理解しておきましょう。
これは知っているといろいろと便利に使えますから。
    • good
    • 1

平均=(∑xi)/n=a


2乗平均=(∑xi^2)/n=b
とすると
分散×n=∑(xi-a)^2=∑xi^2 -2a∑xi +na^2
=n(b - a^2)

で左の証明の最小値と一致します。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!