「平成」を感じるもの

問題
 20個の値からなるデータがあり,
 そのうちの8個の値の平均値は3,分散は4,
 残りの12個の値の平均値は8,分散は9である。
 またこのデータ全体の平均値は,6である。
 このデータの分散を求めよ。

答え
 13

疑問
 この問題の全体の偏差平方和を求めるとき、
  『全体の偏差平方和』
 =「8個のデータの偏差平方和」
 +「12個のデータの偏差平方和」
 +「8個のデータの平均と全体平均6の平均の差の2乗和」
 +「12個のデータの平均と全体平均6の平均の差の2乗和」
 となる理由がわかりません。

『疑問』か『問題の解き方』を数Ⅰの範囲内(Σなどはなし)で教えていただけると助かります。

質問者からの補足コメント

  • うーん・・・

    20個のデータをa,b,c...として式にまとめてみましたが、この後どうすれば良いのかわからないので教えてください。

    「【 数I 分散 】」の補足画像1
      補足日時:2023/02/27 19:38
  • [No,2さんの回答について]

     (x1 - M)^2 + (x2 - M)^2 + ・・・ + (x8 - M)^2
    = [(x1 - Mx) - (M - Mx)]^2 + [(x2 - Mx) - (M - Mx)]^2 + ・・・ + [(x8 - Mx) - (M - Mx)]^2

    上の部分の計算について、
    (x1 - M)^2 が [(x1 - Mx) - (M - Mx)]^2なる
    つまり、「全体でのx1の偏差の2乗」が『「8個内でのx1の偏差」−「全体平均−8個のデータの合計」』となる理由がわかりません。

    また、「x1 + x2 + ・・・ + x8 = 8Mxだから、第2項は =0」となる理由もわかりません。

    私の理解力が低くて申し訳ないのですが、こちらの補足疑問にも答えていただけると助かります。

      補足日時:2023/02/28 20:11

A 回答 (3件)

>20個のデータをa,b,c...として



そんなことをするから、かえってややこしくなるのです。

「8個のデータ」を x1 ~ x8 としましょう。
そうすれば
 Mx = x1 + x2 + ・・・ + x8 = 24   ①
 Sx = (x1 - 3)^2 + (x2 - 3)^2 + ・・・ + (x8 - 3)^2 = 32   ②
ということ。
(各々、データ個数の「8」で割れば平均、分散になる)

同様に、「12個のデータ」を y1 ~ y12 として
 My = y1 + y2 + ・・・ + y12 = 96   ③
 Sy = (y1 - 8)^2 + (y2 - 8)^2 + ・・・ + (y12 - 8)^2 = 108   ④

これから、全体の平均は、①③より
M = (x1 + x2 + ・・・ + x8 + y1 + y2 + ・・・ + y12)/20
 = (Mx + My)/20
 = (24 + 96)/20
 = 6
と求まる。

同様に、全体の分散は
 [(x1 - M)^2 + (x2 - M)^2 + ・・・ + (x8 - M)^2 + (y1 - M)^2 + (y2 - M)^2 + ・・・ + (y12 - M)^2]/20
で求まる。
ここで、前半は
 (x1 - M)^2 + (x2 - M)^2 + ・・・ + (x8 - M)^2
= [(x1 - Mx) - (M - Mx)]^2 + [(x2 - Mx) - (M - Mx)]^2 + ・・・ + [(x8 - Mx) - (M - Mx)]^2
= [(x1 - Mx)^2 - 2(x1 - Mx)(M - Mx) + (M - Mx)^2] + [(x2 - Mx)^2 - 2(x2 - Mx)(M - Mx) + (M - Mx)^2] + ・・・ + [(x8 - Mx)^2 - 2(x8 - Mx)(M - Mx) + (M - Mx)^2]
= [(x1 - Mx)^2 + (x2 - Mx)^2 + ・・・ + (x8 - Mx)^2] - 2(M - Mx)[(x1 - Mx) + (x2 - Mx) + ・・・ + (x8 - Mx)] + 8(M - Mx)^2
= [(x1 - Mx)^2 + (x2 - Mx)^2 + ・・・ + (x8 - Mx)^2] - 2(M - Mx)(x1 + x2 + ・・・ + x8 - 8Mx) + 8(M - Mx)^2

ここで、①のように
 (x1 + x2 + ・・・ + x8)/8 = Mx
つまり
 x1 + x2 + ・・・ + x8 = 8Mx
なので、第2項は =0 となり
= [(x1 - Mx)^2 + (x2 - Mx)^2 + ・・・ + (x8 - Mx)^2] + 8(M - Mx)^2
= Sx + 8(M - Mx)^2

この第1項が「8個のデータの偏差平方和」であり、第2項が「8個のデータの平均と全体平均6の平均の差の2乗和」です。

y についても同様です。


なお、Σ は、上のように x1 + x2 + ・・・ + x8 などを「簡略化して表記」するだけのものですから、上のように長々と式を書くよりも分かりやすいものです。
慣れだけの問題ですから、うまく活用した方がよいですよ。
Σ を使わないと、上のように延々と長い式を毎回か書かないといけないので、面倒だし「誤記」のリスクが増えます。
    • good
    • 1
この回答へのお礼

ありがとう

こんなに長い回答、本当にありがとうございます‼
ただ、回答内容についての疑問があるので補足に書きます。
答えていただけると助かります。

お礼日時:2023/02/28 19:58

No.2 です。

「補足」について。

>上の部分の計算について、
(x1 - M)^2 が [(x1 - Mx) - (M - Mx)]^2なる
つまり、「全体でのx1の偏差の2乗」が『「8個内でのx1の偏差」−「全体平均−8個のデータの合計」』となる理由がわかりません。

いやいや、単に
 x1 - M
を、ダミーの Mx を入れて(+Mx と -Mx の合計 0 を加えているだけ)
 (x1 - Mx) - (M - Mx)
にしているだけです。

先々の変形の準備として機械的にそうしているだけ。

>また、「x1 + x2 + ・・・ + x8 = 8Mxだから、第2項は =0」となる理由もわかりません。

第2項の
 2(M - Mx)(x1 + x2 + ・・・ + x8 - 8Mx)
の後半が
 x1 + x2 + ・・・ + x8 - 8Mx = 0
になりますよね?

一つ一つの式の「理由」を考える以前に、「式の変形が成り立つかどうか」という目で見てくください。
何故最終結果が得られるのかを説明するための「式を変形している」のであって、一つ一つの式変形が意味を持っているわけではありません。
あくまで「ほら、最終結果が得られるでしょ?」というための式変形です。
    • good
    • 1
この回答へのお礼

助かりました

そういうことだったんですね。
本当にありがとうございました‼

お礼日時:2023/03/01 16:49

20個のデータを a, b, c, ... と書いてがんばって式にすればいい. それは実行できるのではないか?

    • good
    • 1
この回答へのお礼

回答ありがとうございます。

お礼日時:2023/02/28 19:56

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


おすすめ情報