プロが教えるわが家の防犯対策術!

(階級値×相対度数)の合計が平均値になるのはなぜですか?

A 回答 (4件)

企業で統計を推進する立場の者です。



#1さん#3さんがおっしゃるように、(階級値×相対度数)の合計が平均値にはなりません。近似値です。

ビン(階級の範囲)の幅を極端に小さくしていけば、真の平均値に漸近します。

g(x)をスコア関数、f(x)を確率密度関数とすると、スコアの期待値(平均値)は次の式で定義されます。これを1次の積率と言います。

E(g(x))=∫g(x)f(x)dx

1次の積率は、「(階級値×相対度数)の合計」の極限になっています。

ご質問について「なぜか」を述べるなら、極限までやらなくても、まあまあ近似できるということです。
    • good
    • 2

「階級値」というのは、「71点~80点は『75点」という階級値とする」というようなことですか?



だとすると、#1 さんのおっしゃるように「正確な平均値」にはなりませんね。
「相対度数」というのは、「その階級の度数の、全体の度数に対する割合(全体の何%か)」ということですね?

たとえば、「テストの成績のクラス平均値」は、「全員の得点の合計を、クラスの人数で割る」ですよね。

30人のクラスだったら、30人分の点数の合計を30で割る。
このとき、1人1人の相対度数は「1/30」ですから、
「合計してから 30 で割る」
のと
「各人の得点に相対度数(1/30)をかけて合計する」
のが同じだと分かりますね?

そして、「同じ点数」の人が何人かいたら、いちいち足し合わせるのではなく
 その点数 × 人数 × 1/30 = その点数 × 相対度数(3人なら 3/30=1/10)
で計算すればよいことも分かりますね?

ご質問は、この「各自の点数」を「階級値」にしただけの話です。
テストの点数も、ある意味で「小数点以下の部分点を切り捨てた階級値」(連続的に分布する「成績」を 0~100 の整数値で階級に分けた)ですから、
「(階級値×相対度数)の合計が平均値」
になっている例とも言えます。

ただしこれを
「0~9点は、階級値5点」
「10~19点は、階級値15点」
・・・
のように「粗い分け方」にして
「(階級値×相対度数)の合計」
を求めたら、「本当の平均値」からはズレますね。

「もともとが階級値しか存在しない」(そういうデータしか存在しない、上に書いたように「テストの点数は、小数点以下の部分点を切り捨てた階級値」と考えるような場合)には、「テストの点数 = 階級値」なので
「(階級値×相対度数)の合計が平均値」
になります。
この式は「階級値しか存在しない場合の平均値の決め方」ということかと思います。
「なぜ」というよりは、「階級値で表示されたデータの平均値」をそのように「定義する」ということです。
    • good
    • 1

階級値×相対度数 = 階級値×(Σ度数)/総数


        = Σ(階級値×度数)/総数
        = 階級値の総和/総数.
だからじゃないですか?
    • good
    • 0

なるのはなぜですか?とのことですが。

なりません。

事実は「適切な階級の取り方すれば、だいたい平均値と同じになる」です。

以下のデータを使い実際にやってみます。
https://examist.jp/mathematics/data/dosuubunpu/
平均値は46.45、対して「(階級値×相対度数)の合計」は46です。

「(階級値×相対度数)の合計」という計算は、個々のデータを階級値に置き換えた上で平均値を求めるのと同じ計算です。この置き換えの時点で誤差が発生します。もし実際のデータと階級値の乖離が激しければ誤差は大きくなります。

たとえば前述のデータについて、極端な話、階級を0以上100未満, 100以上200未満、という風に取れば、すべてのデータが0以上100未満の中に入ってしまいます。すると「(階級値×相対度数)の合計」は階級値そのもの、50ということになる。

では階級を0以上200未満, 200以上400未満、という風にとったらどうなるか。答えは言うまでもないでしょう。
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!