No.4ベストアンサー
- 回答日時:
#2です。
お礼、ありがとうございました。
ご質問者が#1さんの補足に書かれたデータが、まさに「べき分布」です。
これが、パン屋でなく洋服店なら、
冷やかしの客がいるから購入数0点が最も多く、
「本日の1客あたりの売上げ0点」となってしまいますね。
ただ、最頻値(モード:洋服のモードと同じ語源なんですよ)は、
#3さんが言われているように、情報量が少ないというか、「鈍感」な値です。
中央値(メディアン:旧JISではメジアンですが、今はメディアンです)も同じです。
もし、その日、ハリウッドスターのような大金持ちが来店して、
100点1000万円の買い物をしてくれても、
最頻値「本日の1客あたりの売上げ0点」
中央値「本日の1客あたりの売上げ2点」
と変化しません。
群の代表となる値は、
このような変化点を発見したいのか、あるいは、
多くの人が納得できる(所得のような)値にしたいのか、
で、選択する必要がありますね。
No.5
- 回答日時:
代表値という言葉から想像つくように、そこにはある集団の特徴を簡単に表現したいという意図が込められています。
この意識化においては、1つの集団だけ考えても意味はないのです。ある集団と別のある集団をある事柄において比較したいという意図です。例えば、日本人とアメリカ人ではどっちが背が高いのだろう。個人どうしなら答えは正しくでますが、集団と集団を比べるわけですから簡単じゃありません。なので、代表値という概念が考えられたのでしょう。よく知られた平均等々。でも、その集団で最も背の高い人を代表値にしたってかまわないと思いますよ。
繰り返しますが、何が適切な代表値かはその関心事(比較したいもの)によるというしかありません。
パン屋の例で一人当たりのパンの購入数の多い少ないに関心がある場合、パン屋Aとパン屋Bを比べてみたい。どんな代表値にすれば良い?30人やってきて買ったのが10人とすれば、中央値はなに?0個でしょう。最頻値はなに?0個でしょう。
統計といえば確率論をベースにした推測統計を議論することが多いようですが、記述統計の世界もあるわけです。(要するにデータの要約ですね)
ではデータが名義尺度(数値でないデータ)No3さんの上げた旅行の計画のような場合、代表値は? 平均値もなければ中央値もありませんしね。なので、グループの行き先の代表値を選ぶとすると代表=最頻値=東京とするのもありでしょうね。別のグループの代表値=最頻値=京都&ハワイになったらどうするのでしょう?
う~ん難しいね。いずれにしても何が代表値として適切かなんて一概に答えられません。(私には)
No.3
- 回答日時:
情報量は、平均値>中央値>最頻値になるので。
最頻値は、どれが多いかで、どの程度多いか、定量的な扱いはしにくいか、あまり意味が無い。下の例では、「東京」「京都」「ハワイ」は、本質がことなるので(東京≠京都)、単純な比較は意味が無い。最頻値が東京になったからといって、東京が良いわけでもないし、別の集団で調査すれば結果が異なるかも。
中央値は、10万円と100万円は、数値が違うだけで、同じ万札を使うので比較が可能。誰が考えても、どこで調査しても10万円の方が100万円より少ない
手前味噌ですが、ご参考までに。
http://oshiete.goo.ne.jp/qa/7883537.html
No.2
- 回答日時:
企業でSQCを推進する立場の者です。
まず、「資料」ではなく「試料」ですね。
正解が最頻値になっていない理由は、
現在の非対称分布が、「どこかに山の頂がある分布と明確に言っていない」からです。
もちろん、全国の世帯の所得とかいう場合は「最頻値」の方が適切です。
では、今、解答としてなぜ不適切かというと、
べき分布のような分布があるからです。
たとえば、毎分0秒に車の速度を計測したとしましょう。
すると、時速0km/hが最頻で、だんだん度数が減じていく分布となります。
このとき、分布を代表する値が0km/hではまずいのです。
#1さんの、多峰だからというのは理由にはなりません。
多峰であれば、まず混合状態を分離することから行わなければなりません。
多峰のどれかが群の代表というのは、あまりにも統計の常識から外れています。
たとえば所得なら、1人世帯、共働き、子供の扶養あり、
で「層別」して最頻値を求めるべきでしょうね。
No.1
- 回答日時:
最頻値は複数ある場合があるからが理由のひとつなのでしょう。
が、どんなデータをどんな目的で統計処理しようとしているのかが分からないと答えはでないのでは?仮に分かったとしてもどちらが適切かは一概に言えないかと思いますがね。
「適切さ」をきちっと(数学的に)定義しないと(数学的な)答えはでません。
この回答への補足
回答ありがとうございます!
そして言葉不足ですみませんでしたm(_ _)m
パン屋での、1人あたりのパンの購入個数のデータです。
1個・・・29人
2個・・・24人
3個・・・12人
4個・・・11人
5個・・・6人
6個・・・6人
7個・・・5人
8個・・・8人
合計・・・100人
上の結果の場合、代表値に適切なものはどちらかというものです。
回答よろしくお願いします!
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 統計学の問題です よろしくお願いします 代表値 次の15件のデータについて,以下の問いに答えよ。 結 1 2023/01/31 18:53
- 統計学 統計学の問題です よろしくお願いします 代表値 次の15件のデータについて,以下の問いに答えよ。 結 5 2023/01/31 23:35
- 統計学 統計検定2級の過去問について 1 2023/01/04 16:40
- パチンコ・スロット パチスロの初当たり平均枚数について質問です 1 2023/08/22 09:59
- 物理学 電気磁気測定の整流形電圧計の問題についてです。 写真の問題についてで、正弦波での実効値Ve、最大値V 2 2023/02/16 11:12
- C言語・C++・C# このプログラミング誰か教えてくれませんか 1 2022/06/02 15:27
- 大学受験 合同式 1 2022/09/03 12:37
- 電気工事士 平成27年度下期の問題なのですが 2 2022/08/11 20:52
- 数学 【 数I 分散 】 3 2023/02/26 21:55
- 統計学 統計学の問題です よろしくお願いします 回帰直線 次のデータから集計表を作成し,以下の問いに答えよ。 2 2023/01/31 23:36
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
「an=(n-1)/(n+1)のときlim[n→∞...
-
マイナスからプラスへ転じた時...
-
2÷3などの余りについて
-
Aの値からBの値を除するとは??
-
a^2の√=a が成り立たない場合
-
信頼区間の1.96や1.65ってどこ...
-
エクセルで可視セルにのみ値貼...
-
10%引いた元の数字を出すには?
-
変数とパラメータとは違うもの...
-
中間値の定理を用いて実数解を...
-
Excelで1つしかない値だけを抽...
-
度数分布表の階級の端の値
-
ある商品のロス率を5%見込み、...
-
1/3 と 0.33・・・ 同じです...
-
値差の%計算方法について
-
収束する関数を探しています
-
20'(角度)の計算がわかりま...
-
エクセルのオートフィル?ドラ...
-
大学数学の問題です。 加法群Z/...
-
数学 反比例 y=1/2xとはどうい...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
マイナスからプラスへ転じた時...
-
2÷3などの余りについて
-
信頼区間の1.96や1.65ってどこ...
-
Excelで1つしかない値だけを抽...
-
変数とパラメータとは違うもの...
-
「Aに対するBの割合」と「Aに対...
-
10C7 =10.9.8.7.6.5.4/7.6.5.4...
-
0 <= ある値Aのある値B乗 <= あ...
-
20'(角度)の計算がわかりま...
-
ある商品のロス率を5%見込み、...
-
中学数学 代表値について
-
Aの値からBの値を除するとは??
-
教えてください。数学Bの二項分...
-
エクセルで可視セルにのみ値貼...
-
a^2の√=a が成り立たない場合
-
比と比の値について。 a:b=a/b ...
-
EXCELの分散分析表のP-値が....
-
値差の%計算方法について
-
10%引いた元の数字を出すには?
-
パーセントの出し方を教えて下さい
おすすめ情報