アプリ版:「スタンプのみでお礼する」機能のリリースについて

平均値は異常値に引っ張られ、データが大きくなったりすると聞きました。
中央値はそのような影響を受けないとも聞きました。

平均年収などは、一部の高給な人が平均年収を吊り上げているので
より現実に近いのは中央値だとも聞きました。

中央値<平均値

となるケースはあると思いますが、

平均値<中央値

となることもあるのでしょうか?

無効な数字がある場合は、除外してエクセルのaverageやMedianは
異常値をはじいて出してくれるのでしょうか?
(1,2,3,4 という数字の中に あ、か、さ、のようなひらがながある場合)

教えて頂ければと思います。

A 回答 (2件)

データの分布が左右対称であれば、


平均値=中央値
となりますが、
不均等であれば、平均値と中央値はずれてきます。
代表的なものは年収で、大きく高年収側に偏った分布となり、
平均値>中央値
となります。

>平均値<中央値
>となることもあるのでしょうか?

当然あります。
たとえば寿命は、病気、事故などで若くして亡くなる人がいるのに対し、
長寿側は自ずと制限されます。150歳で亡くなる人は現実にはいません。
平均値<中央値
となります。

尚、エクセルはエラー以外の無効なデータは除外して計算してくれます。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

お礼日時:2013/10/23 23:54

>データが大きくなったりする


大きくなることもありますし、小さくなることもあります。
つまり、平均値<中央値となることも当然あります。

平均値とは、ある項目の値の合計を、値の数で割ったもの。
中央値とは、データを大きさで並べた時に中央に位置するもの。

つまり、100、50、25、12、6という5つの数字があった場合、
平均値は38,6で中央値は25になります。
また、100、90、80、70、0という5つの数字があった場合には、
平均値は68で中央値は80になります。

エクセルのaverageやmedianは、文字ははじいてくれますが、数式のエラーが入っていたりすると、そのままエラーになってしまいます。
何をするかによりますが、統計を取るのであればクリーンデータにする方が効果的です。
また、ものによっては中央値とするだけでは不十分で、上位下位から一定数を除外した後で中央値を取ったり、分布図と合わせて検討する必要があるものもあります。
よく「数字は嘘をつかない」と言われますが、「数字の見せ方で人をだます」のもポピュラーな手法です。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。

お礼日時:2013/10/23 23:55

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!