
No.1ベストアンサー
- 回答日時:
手順は下記のとおりです。
(1) 5つの値の平均を求める。
(2) 5つの値それぞれについて、「平均との差」=「偏差」を計算する。
平均より大きければプラス、平均よりも小さければマイナスの値になる。
(3) 5つの「偏差」をそれぞれ2乗する。=「2乗偏差」
すべて「プラス」の値になる。
(4) 5つの「2乗偏差」を合計する。=「2乗偏差和」
(5) 「2乗偏差和」を5(データ数)で割る。つまり「2乗偏差の平均」と求めたことになる。
これが「分散」。
この「分散」が「ばらつきの大きさ」を示す指標になります。
なぜって、そう決めたから、というだけです。
(2) の「偏差」は「プラス」も「マイナス」もあるので合計すると0になり、「ばらつき」の指数には使えません。なので「2乗」して「全部プラス」にしてから、その「平均」を「ばらつきの指標」にしたのです。
(6) 分散の「平方根」が「標準偏差」です。
なので、あなたの書いた式の「分子」が「2乗偏差和」で、それを 5 で割って、その結果を平方根しているなら合っています。
(あなたの式では、どこまでルートの中に入っているのか、どこまでのものを 5 で割っているのか、全く不明確です。
ふつうに見れば、ルートの中に入っているのは「(1500-2100)^2」だけだし、5で割ってるのは「(3000-2100)^2」だけです。
見方によっては、最後の項は「(3000-2100) の (2/5)乗」とも読めます。
別に意地悪で行っているのではなく、数式の書き方の「約束事」のことを言っています。)
(7) 「不偏標準偏差」というのは、テキストに書いているのですか?
通常では、「2乗偏差和」を5(データ数)ではなく、4(データ数 - 1)で割ったものを「不偏分散」とよびます。
偏差を計算するときに、「母集団の平均」ではなく「標本の平均」で計算しているので、「標本の平均」のばらつき分だけ「ばらつき(分散)」が大きめになる、その補正のために「データ数」ではなく「データ数 - 1」で割っている、と理解すればよいと思います。
でも、これは「標本のばらつき」と「母集団の持っているはずのばらつき」を比べたいときに使うものであって、そういう用途で使うとき以外にはふつうは使いません。
「分散」の平方根は「標準偏差」になりますが、「不偏分散」の「平方根」は特にこれといった意味はありません。それを「不偏標準偏差」と呼ぶことは通常ありません。
あなたがお使いのテキストで、便宜上そう呼んでいるかもしれませんが、世の中全体に「常識」として通用するかどうかは疑ってかかってもよいかもしれません。
ただ、ここではそういう議論をする場ではなさそうなので、機械的に
不偏標準偏差 = √{ [(1500 - 2100)^2 + (2000 - 2100)^2 + (2200 - 2100)^2 + (1800 - 2100)^2 + (3000 - 2100)^2] / 4 }
で求めればよいと思います。
No.3
- 回答日時:
「不偏標準偏差」このところ横行しているのが心配。
JISの改悪のせいだ。そんな用語はない!
#1さん、もっと強く言って下さい。不偏分散までは良いが、その平方根は不偏になっていないのですから。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報
エクセル上でしたいです。