質問があります。
派遣業務で消費者ユーザーの特性を調べているのですが、なぜか会社では、平均値を使わず、中央値でユーザー特性を調べています。
、動向を知るには平均の方がいいと思うのですが統計学的に見て中央値を使うメリットデメリットを教えてください。また、統計学に興味を持ち始めたのですが、(実は大学時代勉強したはずなのですがもうすっかり忘れてしまっているので・・・)これからは実際の業務として役立つようにしたいのでお勧めのサイト書物がありましたら教えてください。標準偏差とか誤差を勉強したいです。派遣とはいえ統計を扱う以上しっかりしておきたいのでお願いします。
No.1
- 回答日時:
研究で統計を扱っているものです。
統計が専門ではありませんのでご了承ください。
まず、中央値と平均値の件ですが、
サンプルが正規分布している場合には、
ほとんどの場合平均値を用いることが多いと思います。
平均値と標準偏差で、サンプルの分布を表すことが可能です。
しかし、正規性がないサンプルの場合、
平均値と標準偏差ではサンプルの分布を表すことが難しくなります。
そのため、中央値を用いるわけです。
また、中央値だけでは分布を表せないので、
25パーセンタイル値、75パーセンタイル値を合わせて用いることが多いと思います。
もう一度扱っているデータの分布をグラフにしてみるなどするといいかもしれませんね。
あと、統計に関しては、
↓のサイトが詳しくてお勧めです。
ご参考まで。
参考URL:http://aoki2.si.gunma-u.ac.jp/index.html
中央値がばらつきに左右されないというこがわかりましたが、どうしてそうなるのかとういうことがいまいちよくかみしめられていません。
でも、上記のことがわかったことだけでも嬉しいです。
勉強してみたいと思います。
No.2
- 回答日時:
> 消費者ユーザーの特性
こちらがどういうものか?次第ですね。
例えば、5人の消費者が特定の商品に1年間に使う金額を、
1)
300円 280円 360円 290円 320円
ですと、平均値=310円、中央値=300円で、どちらを使ってもさほど問題ありません。
2)
20円 0円 0円 10円 158,000円
ですと、平均値=31,606円、中央値=10円と、大きく違います。
算出した動向をどのように使うか?によって、どちらがいいかってのは変わって来ます。
「一人のユーザーが使う金額はだいたいどれくらい?」だと中央値が良いかも知れません。
「他の製品と比較する時の収益性は?」だと平均値の方が良いかも。
一般的に平均値を良く使うのは、計算が楽だって面もあります。
並べ替えはちょっと面倒です。
No.3
- 回答日時:
中央値はデータを小さい順から並べていったときに真ん中に来る値です。
平均値は文字通り平均の値です。中央値を使う事については、例えば「大根一本の値段」を無作為に100件の店から導き出そうとするときに、バラツキ(分散)に左右されないということです。100件中5件が一本2万円で売っていたとしたら、その他95件が100円前後で売っていたとしても「大根一本の値段」が平均で1100円近くしてしまいます。だから、バラツキに左右されない中央値の方を使っているんだと思います。学生なんでこの位しか分かりません。解りづらかったらスミマセンです。No.4
- 回答日時:
> 動向を知るには平均の方がいいと思うのですが
なぜそのように思うのでしょう?
一般に集団の代表値としては平均値が用いられることが多いのは事実ですが、他の方の回答にもあるようにそれは平均値が数学的性質が良いこと、計算がしやすいことが主な理由です。しかし平均値が何を表しているかを考えると結構難しいのではないでしょうか。私が知る限り「分布の重心に相当する」ということ以上の明確な意味は無いように思います。一方で中央値はその値よりも大きい特性値を持つ人が全体の半分、小さい特性値を持つ人が半分という直感的に明確な意味を持っています。
No.5
- 回答日時:
>消費者ユーザーの特性を
よりおそらく計数(1人.2人....と数える)でしょう。すると.ガウス分布になりませんので.平均値が存在しません。平均値での議論は数学的に無意味。
No.6ベストアンサー
- 回答日時:
統計学は、「分かりやすい・・・」というようなタイトルでも、分かりやすいとは、思いません。
学生時代にサッパリ分からなかった経験から、不得意な数学的な根拠を無視して、統計学を利用することだけを目的にして、書きます。>消費者ユーザーの特性
統計学は、その特徴を知りたい対象とするグループの特性を数値で表すものです。数値で表すと、分かりやすいからです。成績の平均点が高いと、『賢いなグループ』ということになります。
グループを集団といいます。この場合、消費者ユーザー全員を母集団といいます。母集団のデータは、その数が多い場合は、中央付近の人が多い形(ベル)のようにになり、これを正規分布といいます。
母集団の特徴を現す数値を代表値といいます。代表値には、お馴染みの平均値、それ以外に中央値、さらに最頻値、などを用います。
通常、平均値が用いられます。これは、二つ以上の集団の比較に、検定という作業をするのに便利だということもあります。ただ、平均値を用いる場合は、その集団が正規分布をしていることが、絶対的な前提条件になります。日本の貯蓄額の平均値は、700万円とか。しかし、多くのの家庭は、「そんなにナイゾ」と叫びます。これは、一握りの金持ちが、握り締めているからです。アメリカでは、この差はもっと広がります。すなわち、データの分布が、正規分布していないから、こういうことになります。
そこで、考えられたのが中央値です。正規分布していなくても、データを順番に並べると、真ん中付近の者が多いことから、中央値をその集団の代表値にすると、納得する者が多いので、代表値としてふさわしいのです。
ちなみに、集団が正規分布をしている場合は、平均値と中央値は、一致します。
まとめますと、平均値は、計算しやすい、聞いてる人が慣れていますが、正規分布が前提になります。データの数が多いと、正規分布になるハズデスが、貯蓄額のように数千万人が対象でもナラナイ場合もあります。
中央値は、正規分布していなくてもOKだが、算出がやや面倒、多くの人は慣れていないので説明が必要かもしれません。
消費者の動向などでは、平均値も中央値も使えない場合があります。その場合、最頻値が有効で、これは案外無意識に使っています。
私の過去の回答に、検定や回帰分析などの初心者向けの回答をしています。統計学的な数学は苦手なので、いまだに初心者ですが、使い方は間違っていない、と思っています。
統計学は、慣れです。
釈迦に説法の点は、ご容赦を。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 母平均の検定(両側t検定)の問題 2 2023/03/14 20:02
- 高校受験 夏休み、本気で勉強を頑張りたい 2 2022/07/03 16:33
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 統計学 統計学、エクセルがわかりません!解答と詳しい解説をお願いします! (1)それぞれの地域別に記述統計量 9 2022/08/21 16:30
- 大学受験 国立受験 11月からの大逆転劇を起こすには 7 2022/11/14 19:24
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 統計学の問題です。よろしくお願いします。 ある部品の重量は正規分布に従うとされており,過去の経験から 1 2023/01/19 03:36
- 中学校 中2女子です。私は最近医者を目指したいと考えているのですが、目指す上でいくつか知りたいことがあります 10 2023/05/09 03:43
- 大学受験 高校の総勉強時間を教えてください。 私の学校は授業の勉強の時間がよく潰れているようで、他校より勉強時 2 2023/04/09 23:36
- 統計学 t検定について教えてください 2 2023/02/23 16:35
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
全商推薦について教えてください。
-
下の対数表示のグラフから低域...
-
溶解度の問題 理科
-
サンプル数の異なる2群間にお...
-
検量線の決定係数について
-
EXCELにてローパスフィルタを作...
-
心理機能診断をしたのですが、...
-
検定統計量の値がマイナス
-
片対数グラフで…
-
グラフは横軸がすべり、縦軸が...
-
統計学の問題でわからないので...
-
標準偏差の分母にルートをかけ...
-
エクセル統計のランク化した数...
-
aを実数の定数とする。二次関数...
-
IGORの使い方
-
極値をもつ時と持たない時、単...
-
エクセルのグラフから半値幅を...
-
統計学、2郡間の検定で困って...
-
ANOVAのF値の意味
-
データが正規分布しているか判...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
エクセルでランダム関数で乱数...
-
ブラック・ショールズ方程式を...
-
複数の集団の全体平均が0より有...
-
検量線の決定係数について
-
ポアソン回帰でのカウントデー...
-
青い下線部分はなぜそうなるの...
-
統計学の問題でわからないので...
-
[Excel] リストからの無作為抽出
-
x^2+y^2はどのような分布をする?
-
エクセルのグラフから半値幅を...
-
統計について
-
極値をもつ時と持たない時、単...
-
エクセルで正規分布かどうかを...
-
パイロットサンプルって何ですか?
-
データが正規分布しているか判...
-
回帰分析の回帰係数のt検定
-
正規分布について
おすすめ情報