初めて自分の家と他人の家が違う、と意識した時

(気象)気温は平均のほうが、中央値(あるいは最頻値)よりも必要性があるのはなぜでしょうか?
年収は高額所得者が平均を吊り上げるため平均年収よりも中央値のほうが実態(一般人)にあっていると聞きます。
では気温も平均値よりも中央値のほうが大幅な外れ値が影響しないので良さそうに思えるのですが、実際気象庁は平均気温を出していますし、この「教えて」でも中央値をわざわざだす必要性はないようなことを言われました。
どうして中央値の気温は不要あるいは平均気温より必要性がないのでしょうか?

A 回答 (7件)

No.3です。

「お礼」に書かれたことについて。

>年平均ではなく年中央値のほうが異常気象のような外れ値を外せてより実際の普通の気温に近くなりませんか?

「外れ値を外す」というのは、「説明のつかない、都合の悪いデータを除外する」ということであり、それはある種の「データ改ざん」です。
それをするには、それ相応の理論的な根拠が必要ですが、その根拠をきちんと主張できますか?

「平均値」は、説明のつかない、都合の悪いデータも含めて、すべてのデータ群から「それを代表する指標」を求めるということです。
「外れ値といえるかどうか」は、「平均値」と「標準偏差」を使えば、確率の数値付きで評価・判定できます。「統計データ」はそういう使い方をします。

質問者さんは、ある種の「意図的なデータ」を求めたいとお考えのようなので、それは何らかの「仮説」を立てて、その上でその仮説に基づく「論理的」なデータ処理をされればよいと思います。
    • good
    • 0
この回答へのお礼

外れ値をはずすといいかたはてきせつではありませんでした。外れ値の影響が少なくなるといったほうが良かったと思います。中央値にしても全てのデータを含めてのもとですから不適切でした。
有難うございます

お礼日時:2017/01/17 20:31

中央値が平均より優れているのは一部の突出したデータの


影響を受けにくいこと。そういうデータがない、或いは
予め取り除いておけば、中央値の優位性はなくなります。
#統計では前処理として異常データの除去がよく行なわれます。

また、平均値は他の統計処理の基礎データなので、
優位性とは無関係に必要なものです。
    • good
    • 1

>逆にまず平均気温の定義を知った上で回答なさったほうが恥をかかずにすむのではないでしょうか


前回の質問に対して、素敵なお礼をありがとうございます。 少し弁解させていただきますと、私は、中央値について答えただけで平均気温については述べておりません。 今回の質問に対しても、理解いただけなかったようで少し残念です。

中央値というものは、有限のデータをその大きさ別に並べた場合に、その真ん中に来る数値、データ数が偶数の時には中間二つの数値の平均という風に定義されていることはご理解いただけているでしょうか?

ところが気温というものは、どんな時間にも存在している継続的なデータであり、一日24点でも48点でも測定することもできます。 同じ24点でも毎時0分に取った場合と毎時30分で撮った場合には違う集合になります。 そのような観点から、中央値というものは、どのようなデータのとり方をした場合という条件によって違った値になってしまう可能性があるため、どれが正しいということができなくなってしまうという問題がある。

ということです。
    • good
    • 1
この回答へのお礼

また、長々とありがとうございました。平均気温の出し方を知ってないのか、そっちのけなのか、平均気温は連続的なものではなく24点ですから中央値も24点でしようと思えばできるわけですよね。恥の上塗りてきな釈明ご苦労様でした。

お礼日時:2017/01/17 20:24

No.3です。

追加です。

「気温」のような連続変数に関しては、通常では「最頻値」という概念は適用できません。
適用できるのはテストの「得点」のような離散データ、あるいはデータを「区間(階級)」(気温であれば「1℃きざみ」のように)に区切れる場合です。

想像がつくと思いますが、「1℃きざみ」「0.5℃きざみ」「0.1℃きざみ」それぞれで「最頻値」は変わると思います。
    • good
    • 0

統計的には「中央値」というものに意味はありません。


「ランキング」のような「順位」が問題のときに、「ちょうど真ん中の順位」という意味ですから。
「年収」はまさしくそういった「ランキング」のデータです。

「気温」のような「ランダム」なデータはほぼ「正規分布」しますから、「平均」や「標準偏差」でデータを代表させた方が特性がよく表せるのです。

そもそも、気象庁の気温データについては、
(1)毎正時データ24点から日平均気温を求め
(2)その他の気温データ(半旬、旬、月など)は日平均気温から求める
(3)最高気温、最低気温などの「極値」は「10分値」の中から選び出す
というようなやり方ですから、どこに「中間値」を使ったらメリットがあるとお考えなのですか?

一日「24点」の正時データの「中間値」(上から12番目)に、何か意味があるとお考えですか?
    • good
    • 0
この回答へのお礼

24点の日平均値とそれを元にした年平均ですが、年平均ではなく年中央値のほうが異常気象のような外れ値を外せてより実際の普通の気温に近くなりませんか?

お礼日時:2017/01/17 19:45

>どうして中央値の気温は不要あるいは平均気温より必要性がないのでしょうか?


統計を求めることが重要ではないから。
    • good
    • 0
この回答へのお礼

もっと分かるように説明していただけますか?

お礼日時:2017/01/17 16:51

さっきも書いたけど、継続的なデータの中央値は定義できていないってことじゃないかな?



気温を図るタイミングを10分おきにするか、1分おきにするかによって結果が変わるかもしれないし、1分おきの計測値の中央値だって、同じデータからとっても、30秒ずれた点での測定をしたら違う値になるかもしれない。

まあ、ぶっちゃけ微分と同じような観点から、測定間隔を0に無限に近づけけて行って得られる値としてもよいけど、そもそも、関数で表現することが非常に困難である実測値でそれの一般的解法があるとも思えないから、そのように定義したところで求めようがないのでは?
    • good
    • 0
この回答へのお礼

ちょっと何いってるかわかりません。

お礼日時:2017/01/17 16:54

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


おすすめ情報