質問があります。
派遣業務で消費者ユーザーの特性を調べているのですが、なぜか会社では、平均値を使わず、中央値でユーザー特性を調べています。
、動向を知るには平均の方がいいと思うのですが統計学的に見て中央値を使うメリットデメリットを教えてください。また、統計学に興味を持ち始めたのですが、(実は大学時代勉強したはずなのですがもうすっかり忘れてしまっているので・・・)これからは実際の業務として役立つようにしたいのでお勧めのサイト書物がありましたら教えてください。標準偏差とか誤差を勉強したいです。派遣とはいえ統計を扱う以上しっかりしておきたいのでお願いします。
No.6ベストアンサー
- 回答日時:
統計学は、「分かりやすい・・・」というようなタイトルでも、分かりやすいとは、思いません。
学生時代にサッパリ分からなかった経験から、不得意な数学的な根拠を無視して、統計学を利用することだけを目的にして、書きます。>消費者ユーザーの特性
統計学は、その特徴を知りたい対象とするグループの特性を数値で表すものです。数値で表すと、分かりやすいからです。成績の平均点が高いと、『賢いなグループ』ということになります。
グループを集団といいます。この場合、消費者ユーザー全員を母集団といいます。母集団のデータは、その数が多い場合は、中央付近の人が多い形(ベル)のようにになり、これを正規分布といいます。
母集団の特徴を現す数値を代表値といいます。代表値には、お馴染みの平均値、それ以外に中央値、さらに最頻値、などを用います。
通常、平均値が用いられます。これは、二つ以上の集団の比較に、検定という作業をするのに便利だということもあります。ただ、平均値を用いる場合は、その集団が正規分布をしていることが、絶対的な前提条件になります。日本の貯蓄額の平均値は、700万円とか。しかし、多くのの家庭は、「そんなにナイゾ」と叫びます。これは、一握りの金持ちが、握り締めているからです。アメリカでは、この差はもっと広がります。すなわち、データの分布が、正規分布していないから、こういうことになります。
そこで、考えられたのが中央値です。正規分布していなくても、データを順番に並べると、真ん中付近の者が多いことから、中央値をその集団の代表値にすると、納得する者が多いので、代表値としてふさわしいのです。
ちなみに、集団が正規分布をしている場合は、平均値と中央値は、一致します。
まとめますと、平均値は、計算しやすい、聞いてる人が慣れていますが、正規分布が前提になります。データの数が多いと、正規分布になるハズデスが、貯蓄額のように数千万人が対象でもナラナイ場合もあります。
中央値は、正規分布していなくてもOKだが、算出がやや面倒、多くの人は慣れていないので説明が必要かもしれません。
消費者の動向などでは、平均値も中央値も使えない場合があります。その場合、最頻値が有効で、これは案外無意識に使っています。
私の過去の回答に、検定や回帰分析などの初心者向けの回答をしています。統計学的な数学は苦手なので、いまだに初心者ですが、使い方は間違っていない、と思っています。
統計学は、慣れです。
釈迦に説法の点は、ご容赦を。
No.5
- 回答日時:
>消費者ユーザーの特性を
よりおそらく計数(1人.2人....と数える)でしょう。すると.ガウス分布になりませんので.平均値が存在しません。平均値での議論は数学的に無意味。
No.4
- 回答日時:
> 動向を知るには平均の方がいいと思うのですが
なぜそのように思うのでしょう?
一般に集団の代表値としては平均値が用いられることが多いのは事実ですが、他の方の回答にもあるようにそれは平均値が数学的性質が良いこと、計算がしやすいことが主な理由です。しかし平均値が何を表しているかを考えると結構難しいのではないでしょうか。私が知る限り「分布の重心に相当する」ということ以上の明確な意味は無いように思います。一方で中央値はその値よりも大きい特性値を持つ人が全体の半分、小さい特性値を持つ人が半分という直感的に明確な意味を持っています。
No.3
- 回答日時:
中央値はデータを小さい順から並べていったときに真ん中に来る値です。
平均値は文字通り平均の値です。中央値を使う事については、例えば「大根一本の値段」を無作為に100件の店から導き出そうとするときに、バラツキ(分散)に左右されないということです。100件中5件が一本2万円で売っていたとしたら、その他95件が100円前後で売っていたとしても「大根一本の値段」が平均で1100円近くしてしまいます。だから、バラツキに左右されない中央値の方を使っているんだと思います。学生なんでこの位しか分かりません。解りづらかったらスミマセンです。No.2
- 回答日時:
> 消費者ユーザーの特性
こちらがどういうものか?次第ですね。
例えば、5人の消費者が特定の商品に1年間に使う金額を、
1)
300円 280円 360円 290円 320円
ですと、平均値=310円、中央値=300円で、どちらを使ってもさほど問題ありません。
2)
20円 0円 0円 10円 158,000円
ですと、平均値=31,606円、中央値=10円と、大きく違います。
算出した動向をどのように使うか?によって、どちらがいいかってのは変わって来ます。
「一人のユーザーが使う金額はだいたいどれくらい?」だと中央値が良いかも知れません。
「他の製品と比較する時の収益性は?」だと平均値の方が良いかも。
一般的に平均値を良く使うのは、計算が楽だって面もあります。
並べ替えはちょっと面倒です。
No.1
- 回答日時:
研究で統計を扱っているものです。
統計が専門ではありませんのでご了承ください。
まず、中央値と平均値の件ですが、
サンプルが正規分布している場合には、
ほとんどの場合平均値を用いることが多いと思います。
平均値と標準偏差で、サンプルの分布を表すことが可能です。
しかし、正規性がないサンプルの場合、
平均値と標準偏差ではサンプルの分布を表すことが難しくなります。
そのため、中央値を用いるわけです。
また、中央値だけでは分布を表せないので、
25パーセンタイル値、75パーセンタイル値を合わせて用いることが多いと思います。
もう一度扱っているデータの分布をグラフにしてみるなどするといいかもしれませんね。
あと、統計に関しては、
↓のサイトが詳しくてお勧めです。
ご参考まで。
参考URL:http://aoki2.si.gunma-u.ac.jp/index.html
中央値がばらつきに左右されないというこがわかりましたが、どうしてそうなるのかとういうことがいまいちよくかみしめられていません。
でも、上記のことがわかったことだけでも嬉しいです。
勉強してみたいと思います。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
検量線の決定係数について
-
極値をもつ時と持たない時、単...
-
信号処理系の分野に詳しい方に...
-
投稿論文を作成にあたり数年前...
-
Fisherの正確確率検定について...
-
x=2分の3のグラフはどのように...
-
pHの平均値は出せない?統計処...
-
理科のグラフで、直線と曲線の...
-
定積分の問題なんですけど 最小...
-
関数についてです
-
aを実数の定数とする。二次関数...
-
心理学の統計について
-
最小二乗法を反比例の式を元に...
-
統計学の問題でわからないので...
-
統計について
-
線形なグラフとはひとくちに言...
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
カイ二乗検定
-
エクセルのグラフから半値幅を...
-
統計について
-
検量線の決定係数について
-
3群の比較にχ二乗検定を使う場...
-
【統計】有意に「高い」?「低...
-
エクセルの統計でχ二乗検定の結...
-
ノンパラメトリック検定の多重...
-
パーセンテージの平均値2標本の...
-
パイロットサンプルって何ですか?
-
二次関数の問題です 二次関数 y...
-
理科のグラフで、直線と曲線の...
-
心理機能診断をしたのですが、...
-
アンケートの集計分析の基礎(...
-
変化率のみで、有意差の検定は...
-
検定統計量の値がマイナス
-
極値をもつ時と持たない時、単...
-
最小二乗法を反比例の式を元に...
おすすめ情報