アプリ版:「スタンプのみでお礼する」機能のリリースについて

数値の平均を取ることの質問です。
ex)9,6,1,7,5,4 の6個の数値があるとします。
平均を取るとき、6個すべてを足して6で割るのが一般的ですね。
これとは別に、
最大値=9と最小値=1を除いて、6,7,5,4を足して4で割る、
という出し方はありますか?
これのほうがより精度が高いイメージがあるのですが、統計的にもありですか?
よろしくお願いします。

A 回答 (7件)

精度が高いのは、ちゃんと全ての値を使って


6個足して6で割る方法でしょうね。
一部のデータを捨てれば、当然そのぶんの誤差が出ます。
    • good
    • 0
この回答へのお礼

ありがとうございました

お礼日時:2021/11/24 20:34

#5です。



補足ですが、あのヒントの文中の「推定器」というのは誤訳でしょう。
estimator と書いてあったのだと思います。正しくは「推定量」ですね。

たぶん、unbiased estimator 「不偏推定量」にはならない、という趣旨の文章なのだ思います。
    • good
    • 0
この回答へのお礼

ありがとうございました

お礼日時:2021/11/24 20:34

#4です。


コメント、ありがとうございました。
ご質問の趣旨である精度に関して、マスワークスのヒントを解説します。
「誤差は小さいが偏差はある」ということを言っています。


・トリム平均は、データ標本の位置に対するロバストな推定値です。

→標本は採取する都度、尺度上の位置が変わりますが、標本の位置が極端に動いても求められる代表値はロバスト(頑健=影響を受けない)です。つまり、トリム平均は極端に動かないです。


・データに外れ値が含まれている場合、トリム平均は標本平均より適切にデータの中央を表現します。

→もし外れ値が観測されても、トリム平均は普通の平均より適切に母集団の代表値の真値付近の位置を叩きます。(上記の記述の繰り返し)


・ただし、すべてのデータが同じ確率分布から派生する場合、データの位置に対する推定器としてトリム平均は標本平均より有効ではありません。

→ただし観測を繰り返すとき、データの全てが同じ母集団分布から採取される場合、「上で叩き出された位置の平均が真の位置に収束するという推定器」を考えたとき、それは正しくないです。偏差を持ちます。

もし疑問があれば、またご指摘下さい。
    • good
    • 0
この回答へのお礼

ありがとうございました

お礼日時:2021/11/24 20:33

まだ、誰も回答してませんが、それは「トリム平均」ですね。


用語が存在するくらいですから、一般的に使用されます。

ところで、精度ですが・・・

①少数の観測値から求めた代表値が、母集団の真値にどれだけ近いか(誤差が小さいか)
②少数の観測を繰り返したときに、求めた代表値が偏りの無い値であるか(誤差の期待値は0か=不偏性)

つまり、誤差(ばらつき)と偏差(かたより)の2つの視点があります。

トリム平均は①に対して有効ですが、②は悪化します。

https://jp.mathworks.com/help/stats/trimmean.html

↑この解説の一番下の「ヒント」をご参照ください。
    • good
    • 0
この回答へのお礼

トリム平均は、外れ値を除外することでより精度の高い値を取得する。
これを知ることができたので質問した甲斐がありました。
>解説1番下のヒント
今の私には到底理解できません。
(単語の定義を調べていけば理解できるかも)
ありがとうございました。

お礼日時:2021/11/22 09:18

「平均値」とか「代表値」の求め方には、いろいろなやり方があります。



平均値の種類

http://www.ries.co.jp/project/topic_point_of_vie …

中心的な傾向を捉える

http://www.stat.go.jp/naruhodo/5_tokucho/chushin …

いろいろな代表値

https://www.albert2005.co.jp/knowledge/statistic …

質問者さんの
「最大値=9と最小値=1を除いて、6,7,5,4を足して4で割る」
という求め方も、「極端な外れ値を除外して平均をとる」という考え方ですから、けっこう使われると思います。

体操競技やスケートなどの採点競技では、審査員の得点のうち最高と最低を除いた得点を平均しているはずです。依怙贔屓や極端な審判員の存在も想定して「公平さ」を期しているのでしょう。

体操。最後から4コマ目。

https://mainichi.jp/articles/20111031/mul/00m/05 …

スケート。下記の「[M] 演技構成点(項目別)」に書かれています。

http://mak-k.blog.jp/archives/1075844056.html
    • good
    • 0
この回答へのお礼

たくさんのサイトの紹介、ありがとうございます。

お礼日時:2021/11/22 09:07

一口に「平均」と云っても、いろいろな平均があります。


日常的には、データを全部足してその数で割る方法で、
「相加平均」とか「算術平均」と云います。

あなたが言う様に、最大と最小を除いて 計算する方法もあります。
天気予報で云う 「平均気温 」が 身近な例でしょうね。
例外的な データ値を 除外する利点がある 一方で、
データ数が多くなると 殆ど 意味がなくなりますし、
継続的な データ変化への 反映が遅れる 可能性があります。
    • good
    • 0
この回答へのお礼

>データ数多くなると意味なし
確かに。
>継続的なデータ変化への反映が遅れる
んー。
ありがとうございました。

お礼日時:2021/11/22 09:05

> 6個すべてを足して6で割るのが一般的ですね。


数学的には、これが答えです。

> 最大値=9と最小値=1を除いて、
統計上ではよくあるやり方です。
最大値/最小値は、計測誤差を含む異常値、という考え方です。
    • good
    • 0
この回答へのお礼

>計測誤差を含む異常値
ですね、確かそのようなことを聞きました。
”数学的” or ”統計上”どちらを選択するのかな。
ありがとうございました。

お礼日時:2021/11/22 09:02

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!