プロが教える店舗&オフィスのセキュリティ対策術

平均値が意味ある数値となるのは事象が正規分布になる時で、テストの点数分布がこれにあてはまると思います。
私が他に思いつくものと言えば、同一年齢の身体能力や五感の能力ではないかと思います。
しかし、実社会では正規分布となる事象はほとんどないのではないかと思います。

そのため、いろんな統計データの単純平均値をもとに分析することは全く意味がないと思いますが、いかがですか?

質問者からの補足コメント

  • 正規分布でなくても平均値には便利なところがあります。
    多くは、総金額や総時間を算出する時で、客単価などは簡単便利だと思います。

      補足日時:2019/07/28 08:37
  • 質問本文を見ていただくとわかると思いますが、平均値そのものが無意味だと言っているわけではなく、「実社会で遭遇することが多い正規分布以外の事象で平均値をもとに分析することが無意味」だと言っています。
    経験から気づいたことは、科学的に否定も肯定できないことも多いと感じていますので、科学的な視点で回答していただけると、大いに勉強になります。

      補足日時:2019/07/28 08:48

A 回答 (7件)

私もよく、そう思います。


そして、その数値を別のところにに適用しようとするけれど、それって無理では?
と思ったりします(ある試験の標準偏差を、希望する大学の標準偏差と比較することなど)
また、たとえ正規分布になるものであっても、本人にとって「平均値」とか標準偏差を気にしても無意味では?と思うことも多いですね。
    • good
    • 0
この回答へのお礼

質問を投稿したあと、怒涛の32時間勤務になってしまって、一寝入りしてお礼のコメント書いているため、遅くなってしまいましたが、早速の回答ありがとうございます。

お礼日時:2019/07/28 04:12

この問題は今や常識と申しても過言ではないでしょう。



世界の人口のうちほんの一握りの人間の保有する資産の総額が、その他のすべての人間の保有する資産の総額に匹敵するというようなことがよく話題になりますが、このような場合は平均値は全く意味をなさないことになりますので最頻値などで比較することになりますね。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
回答いただいたケースで身近なものとしては、企業のボーナスの平均値があげられると思いますが、どちらの側の実態ともかけ離れた数値になっていると思います。

お礼日時:2019/07/28 04:16

おっしゃるとおりですね。


平均値が意味をなすのは正規分布になるときだけです。
むしろ、平均値ではなく、真ん中の数値、中央値の方が実態に近いでしょう。

下記のサイトでは貯蓄額について平均値と中央値の差を掲載していますが、かけ離れていますね。

30代の平均貯金額と中央値を調査!
https://lounge.dmm.com/canary/24548/
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
そうですね。最頻値や中央値が重要になる事象も多いと思います。

お礼日時:2019/07/28 04:20

平均値は当たり前なので、平均値が代表値とならない例の方がインパクトを与えやすい。

そのような例が話題になることが多いから。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
インパクトをもっと深堀していただくと面白いことに気づいたかも。

お礼日時:2019/07/28 04:22

あなたにとって、「自分自身の値」は平均値とは何の関係もありません。


また「もともと特別なオンリーワン」だと思って生きている人には、「平均」など何の意味もありません。

平均値は「みんなの値」「一般大衆の値」ですから。
最近の若い人は「みんなの○○」が大好きで、そればかり気にしているから、若い人には大いに意味があるのではないでしょうか?
(みんなの好きな食べ物、みんなが着ているファッション、みんなが見る映画、みんなが読む本、みんなが支持する政党、みんなが支持する首相・・・)
また、大衆迎合的、ポピュリズム大好きな政治家や経営者には、とても大事な値です。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
主張したいことわかりますが、質問の回答とはズレている印象を受けました。
例えば、確率において起こる可能性が一万分の一だとしても、遭遇してしまった人には1か0でしかないので、一万のうちの一つに焦点をあてているような気がします。

お礼日時:2019/07/28 04:27

いや、寧ろ世の中のいろんなことを解析した結論が正規分布なわけです。


それだけ世の中に溢れている、ということです。

例えば工場での製品の「でき具合」は正規分布しているのがほとんどで、100±0.5gが仕様の製品であれば、平均100gになるように製造条件を調整するのが常識です。
標準偏差σも、不良率を推定して、儲けが出る範囲に調整しています。


正規分布しないものもたくさんあるし、バラツキも重要なので
・平均値「だけ」をもとに分析する
のでは不十分なことが多いです。
ですが、平均値は間違いなく分布の特徴を表わす数値であり、
・平均値をもとに分析する
ことを「全く意味がない」と、検討すらしようとしないのは間違いです。
    • good
    • 0
この回答へのお礼

回答ありがとうございます。
正しいことを言われていると感じました。
機械はいいですね。故障やエラーは起きてもウソつかないし、絶対的に信頼できることのひとつだと思います。

お礼日時:2019/07/28 04:31

企業で統計を推進する部門にいる者です。

博士(工学)です。

おっしゃる通りです。
これを、数理でなく感覚で感じ取られたというのであれば、すごいと思います。私は学んだときはしばらく理解できませんでした。

数理的な背景から、「実社会では、平均値には何の意味もない」は、近年一般に言われていることで、今後は常識になると思います。

実社会では、変数の数が非常に多いです。例えば工程を監視するため、100程度の特徴量を抽出します。100次元データといいます。

一般的には、データ空間はラグビーボールのようになっていて、多次元正規分布だから中心部分は密度が高くて、周囲に行けばデータはまばらになると思いがちです。でも、100次元のデータでは、それが崩れてくるのです。

データが100次元くらいになると「次元の呪い」という現象が現れます。そのひとつが球面集中化です。各データは原点(平均)から一定距離離れた超球上に集中します。データ中心(平均値)付近は空洞なのです。もともとデータが存在しないのだから、平均値を考慮しても意味が無いわけです。

卑近な事例では、「日本人の平均的な顔」の人は探しても絶対に存在しない。とか、工程内で全ての観測値がほぼほぼ平均値になるような製品があったら、それは「異常品」である。

我々、企業の教育では「次元の呪い」を理解してもらい「高次元データでは統計データの単純平均値をもとに分析してはいけない」と教えています。
    • good
    • 1
この回答へのお礼

回答ありがとうございます。
内容が難しすぎて理解できませんでしたが、私の場合は極めて単純な経験則です。
いずれにしろ、学問のカテゴリーに相応しい専門的な詳しい回答ありがとうございました。

お礼日時:2019/07/28 04:55

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!