プロが教えるわが家の防犯対策術!

分散が大きいとデータの偏りが大きいと習ったのですが、一般的にいくつなら大きい、小さいなのですか?

質問者からの補足コメント

  • 分散の計算ができても、その結果を見て偏りが大きい、小さいの判断ができないのでできるようになりたいです。

      補足日時:2023/08/09 23:39

A 回答 (6件)

分散は2次のモーメント。

皆さんがおっしゃるように、この値はデータの偏りを示す指標ではありません。

データの(分布の)偏りを示す指標は3次・4次のモーメントで、歪度と尖度です。
一般的には、ひずみ、とがり、と言われています。

いずれも、正規分布の場合は値が0になります。

私が習ったときは、それらの絶対値が1を越えるようなら、正規分布でないことを疑え、ということでした。

でも今はPCがあり、正規確率プロットあるいはQQプロットが手軽にできるので、すぐ可視化して確認しますけどね。
    • good
    • 0

>分散が大きいとデータの偏りが大きい



これは間違いです。

正しくは

「分散が大きいとデータのばらつきが大きい」

です。

日本語の問題ですが「偏りが大きい」とは、「どこかにごちゃっと集まっている」「どこかに偏って集中している」という意味になります。
これに対して「ばらつきが大きい」とは、「パラっとバラバラに分かれて存在している」「集中せずに薄く広く分布している」という意味です。

「分散」は、その言葉通りの「ばらつき具合」「分布の広さ」を示す指標です。
なので「分散が大きい」とは、「偏りが大きい」は間違いで、「ばらつき、分布の広がりが大きい」ということを指します。

質問者さんは「数学」「統計」が分からないのではなく、「日本語」が分からないだけだと思いますよ。


>一般的にいくつなら大きい、小さいなのですか?

それは「どのような分布か」によって変わるので、一概には言えません。
「10点満点のテストの点数の分散」と「100点満点のテストの点数の分散」では、同じ結果でも「100倍」違います。
「100点満点」の方が0~100点でばらつくのに対して、かたや0~10点なので、当然ながら「100点満点」の方がばらつきが大きい、従って分散も大きいです。
おなじ100点満点でも、「数学の点数が、0点から100点まで広く分布した」(出来・不出来の差が大きい)ときには「分散」は大きくなるし、
「社会は簡単な問題だったので、ほとんどの人が70~80点とれた」(出来・不出来の差が小さい)ときにh「分散」は小さくなります。
#1 さんが書かれている「分布のグラフ」の「横の広がりが大きいか小さいか」を示すのが「分散」(あるいはその平方根である「標準偏差」)です。
    • good
    • 0

ご質問には二つ間違いがあります。



> 分散が大きいとデータの偏りが大きいと習った

というのは記憶違いか、あるいは、教えた人の誤りです。

「分散が大きいほどデータのばらつきが大きい」という表現ならよく使われます。

 この言い方をもっと正確に言えば、「分布(データの集まり)同士を比べたとき、分散が大きい分布の方が、他方よりもデータのばらつきが大きい」ということを意味しています。

 これはちょうど「円同士を比べたとき、面積が大きい方が半径が大きい」というのと同様の事情です。円を一つだけ持ってきて

> 一般的にいくつなら大きい、小さいなのですか?

と尋ねたって、比べる相手がないんじゃ答えようがない。だからこの質問には意味がない。つまり、そういう問いを発すること自体が間違いです。

言い換えれば、

> 分散の計算ができても、その結果を見て偏りが大きい、小さいの判断ができない

のは当たり前であって、誰も判断できません。
    • good
    • 0

「分散が大きいとデータの偏りが大きい」が間違っています。


もう一度、教科書をご確認願います。
    • good
    • 0

分散の値だけをもって「データの偏りが大きい」かどうかを判定することはできない.



例えば, 分散が 1 であるようなデータセットがあったとしよう. そこに含まれる全てのデータを一斉に 100倍して新しいデータセットを作る. この新しいデータセットの分散は当然 10000 になるわけだが, はたしてこれで「新しいデータセットは前のデータセットよりも『データの偏りが大きい』」といっていいものだろうか?

もっというと, そもそも「データの偏り」をどう定義してるんだ?
    • good
    • 0

分散は「データの偏り」ではなく、データの広がりを表しています


分散の平方根が広がり具合です

例えば、クラス全員の数学の点数について、平均点が60点、分散が100だったとします。分散の平方根は√100なので10となります。つまりこのクラスの数学の点数は平均の60点の周りに±10点くらいの幅で広がっていることになります。
「分散が大きいとデータの偏りが大きいと習っ」の回答画像1
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


このQ&Aを見た人がよく見るQ&A