データの分析を行っていたところ,同一データの平均値が中央値より倍以上大きくなりました.この原因として,外れ値の存在があったため,代表値には中央値を用い,ノンパラメトリックな方法で分析を進めようと考えました.
そこで,代表値に中央値を選んだ理由を,数値的な基準を用いて説明したいと思うのですが,その基準にはどのようなものがあるのでしょうか.
本などを読むと,歪度などで代表値を選択することが書いているのですが,具体的な数値などの基準が分かりません.
そこで,代表値を選択する際の具体的な基準について教えていただければと思います.また,外れ値が結果に影響を及ぼしているという基準も,もしあれば教えていただきたく思います.
よろしくお願いいたします.
No.1ベストアンサー
- 回答日時:
はじめに確認しますが,データの尺度水準は,間隔尺度以上ですね?
間隔尺度以上の場合に,平均,中央値,最頻値のいずれも用いることができます.
質問の内容に関しては,絶対的な基準は存在しません(森・吉田,1990).
また,他のデータに比べ,どの程度離れていれば,外れ値とみなすかについても明確な基準はありません(吉田,1998).
したがって,どの代表値を用いるかや,どの個別データを外れ値とみなすかについては,主観的な判断に任されているといっても過言ではありません.
ただし,南風原(2002)にあるように,次のように考えることはできると思います(南風原,2002,pp.17-27):
1.代表値の適切さの基準を明確に定義し,それを最大にする値を求めるというアプローチを基本的には,採用する.
2.データがN個あると仮定して,「代表値tと,そこに含まれるN個のデータとの近さ」という基準を,「tと各値との距離の絶対値の総和の小ささ」と解釈する,と考える.
3.このように考えると,その総和を最小にするtが,「データ全体に含まれる各値にもっとも近い」という基準を満たす,適切な代表値ということになる.
なお,外れ値の存在が,測定ミスによるものではなく,正しく測定されたにもかかわらず,他のデータからは,相当はずれた値になったという前提で,この説明は成り立ちます.
また,最近の統計書にはあまり書かれていないようですが,正規分布から外れた値と見なせるかどうかに関して,「棄却検定法」があります.
古い本ですが,岩原(1967)のp.135にその説明が,あります.
数式を記述するのが煩雑でしたので,文章で説明してみました.
文献リストを掲げておきますから,ご覧ください.
森敏昭・吉田寿夫(編著)(1990):心理学のためのデータ解析テクニカルブック.北大路書房.
吉田寿夫(1998):本当にわかりやすい すごく大切なことが書いてある ごく初歩の統計の本.北大路書房.
南風原朝和(2002):心理統計学の基礎-統合的理解のために-.有斐閣(有斐閣アルマ).
岩原信九郎(1967):増補版推計学による新教育統計法.日本文化科学社.
詳しいご回答ありがとうございます.絶対的な基準はないようですね.討論する際に代表値の選定やはずれ値の基準を聞かれますので,何かあればと思ったのですが・・・.ご紹介いただいた文献を読んでみて,再考してみます.ありがとうございました.
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 統計検定2級の過去問について 1 2023/01/04 16:40
- 統計学 統計学の問題です よろしくお願いします 代表値 次の15件のデータについて,以下の問いに答えよ。 結 1 2023/01/31 18:53
- 大学受験 推薦入試について教えていただきたいことがあります。 私は、この春高校三年生になります。進路について考 1 2022/04/05 02:04
- 統計学 統計学の問題です よろしくお願いします 代表値 次の15件のデータについて,以下の問いに答えよ。 結 5 2023/01/31 23:35
- Excel(エクセル) VLOOKUP が機能しない、その原因は何 ? 8 2022/10/19 12:06
- 教師・教員 偏差値の高い公立高校の教師は選考基準があるのでしょうか? 公立高校の教師は公務員で異動もありますよね 3 2023/05/27 07:49
- 国産車 先日、20セルシオのフロントテンションロッド交換に伴い、アライメントの調整をしてもらいました。その時 2 2023/05/31 21:20
- 政治 自民党は台湾よりも国民の健康を守ってないですね? 5 2022/07/05 22:37
- 弁護士・行政書士・司法書士・社会保険労務士 行政書士試験の行政法についての質問になります。 行政法の行政法総論についての質問になります。 問 地 1 2023/08/09 17:19
- Excel(エクセル) エクセルの散布図で新たに入力した値のデータラベルが空欄になる現象 1 2022/04/26 09:31
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
応答で層別した場合の検定について
-
EXCELにてローパスフィルタを作...
-
心理機能診断をしたのですが、...
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
脳波(EEG)の周波数は0.5~60Hzで...
-
検量線の決定係数について
-
極値をもつ時と持たない時、単...
-
ポアソン回帰でのカウントデー...
-
検定統計量の値がマイナス
-
統計学 カイ二乗検定とt検定の...
-
数3の複素数です 12分の25πが12...
-
t検定の使いどころ
-
片対数グラフで…
-
両対数グラフでの直線式の求め方
-
高校 数学 aを実数の定数とする...
-
最小二乗法を反比例の式を元に...
-
t検定の記述の仕方を教えてくだ...
-
パイロットサンプルって何ですか?
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
x^2+y^2はどのような分布をする?
-
検定統計量の値がマイナス
-
統計について
-
【統計】有意に「高い」?「低...
-
統計学の基本的なことについて...
-
最小二乗法を反比例の式を元に...
-
心理学の統計について
-
ポアソン回帰でのカウントデー...
-
[Excel] リストからの無作為抽出
-
対数グラフの対数とは・・・?
-
極値をもつ時と持たない時、単...
-
対数目盛の読み方を教えてください
-
溶解度の問題 理科
-
正規分布について
おすすめ情報