「みんな教えて! 選手権!!」開催のお知らせ

13人の点数がそれぞれ以下のようにあったとします。
0、0、0、0、1、1、1、2、2、2、3、4、6
平均点 1.7点 標準偏差が1.8
になります。このとき棒グラフの平均値に±1.8の範囲の
エラーバーを追加するとグラフのマイナスの範囲に入り込みます。
点数は0点以下はあり得ないのでマイナスの範囲に入るのは変だと思うのですが、このようなときにどのようにグラフを書けばよいのでしょうか?

A 回答 (3件)

例えば、0点から100点の数学のテストについて、平均が50で標準偏差が45とかだとすると、「確率的に」0点以下の人はいるだろうと考えられます。

でも実際には平均点が50で標準偏差が45などということは在りえないわけで、かなり部分的なデータしか得られていないということです。

仮にこのようなデータ

  {50, 21, 0, 73, 90, 1, 3}

が得られたときでさえ標準偏差は37.16629ですから、これは母集団から適切にサンプリングできていないと考えるのが妥当です。

だから、今回提示された{0、0、0、0、1、1、1、2、2、2、3、4、6
}というのは、もし正規分布に従っていると仮定するなら、かなり偏ったデータを採取してしまったのだろうといえるわけです。
    • good
    • 1

というか、「平均値に±1.8の範囲のエラーバーを追加する」というのは、普通、意味がありませんよね。



最も適切なのは「平均値±1.96*標準偏差」というエラーバーを書くこと(そうすればデータの95%がこの範囲内に含まれているということが分かる)。あるいは標準誤差を書く場合もありますが、単に標準偏差のみを棒グラフに追加しても、少なくとも見る側には何も十分な情報が伝わりませんね。

だから今回の場合においては、

Mean = 1.692308
S.D. = 1.797434
1.692308 + 1.96 * 1.797434 = 5.215279
1.692308 - 1.96 * 1.797434 = -1.830663

[-1.830663, 5.215279]という範囲内に元のデータの95%が含まれていると解釈する。なぜマイナスになるかというと、母集団が正規分布に従っていると仮定しているから(つまり、本当に正規分布しているなら0よりも小さい値があるはずであると考えているわけ)。

ありえないと考えているのは「分析者だけ」であって、統計学的には全く変なことではないのですね。実質的にありえないのは分析方法が適切でないか、あるいはデータの取り方などに問題があるということです。
    • good
    • 3

もとの分布が正規分布やそれに近いときには平均と標準偏差を使って分布を表現するんだろうけどね....


今の例のように「明らかに正規分布じゃない」場合には, あまりよくないんじゃないかなぁ.
    • good
    • 3

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


おすすめ情報