人生最悪の忘れ物

変動係数は標準偏差を平均値で規格化しているので、標本個々の数値の大きさに差があってもばらつき具合を比較できる指標になると考えておりました。

しかし、例えば業界間の離職率の変動係数と、消費地間のチーズケーキの嗜好性の変動係数、小学生の伸長の変動係数といった、まったく異なる事象について、変動係数でばらつきを比較することができるのでしょうか?

例えば、他の指標となる統計量がどこからどこまでなら適用できる、といった制限等はあるのでしょうか?

お詳しい方、お教え願います。

A 回答 (2件)

No.1です。


No.1では「数式」で書いたので「???」だったのでしょうか?

「正規分布」というものを、どこまで理解されているの変わりませんが、下記のような解説サイトを見ていただければ分かる通り、「基本的には同じ形」の分布です。
http://www.stat.go.jp/koukou/howto/process/p4_3_ …
http://atarimae.biz/archives/9850

「平均値」を中心に、「ピークが尖っているか」「ピークがなだらかか」ということは、その「分布の形」から直接判定できます。
その「ピークが尖っているか、なだらかか」を示すものが「標準偏差」です。分布の形は「平均値」と「標準偏差」で決まります。

「平均値」は、その量が何か、「単位」が何かでいろいろ変わります。
(例えば
「身長」なら140~190cmで平均170cmとか、
「体重」なら50~100kgで平均70kgとか、
「クラスの数学の点数」が20~98点で平均65点とか)
それを「平均値で割ってしまう」ことで
・「身長」:140~190cmで平均170cm → 0.82~1.12で平均1
・「体重」:50~100kgで平均70kg → 0.71~1.43で平均1
・「クラスの数学の点数」:20~98点で平均65点 → 0.31~1.51で平均1
のように「平均値1の周りの分布」として同列で比較できます。
 もともとの「標準偏差」も「平均値で割ったもの」になり、それが「変動係数」と呼ばれるものになります。

「平均値を1にした分布」は、元の分布の形と相似形ですので、「平均値1」の「ピークが尖っているか、なだらかか」(=「変動係数」の大きさで示される)は、もとの分布の「ピークが尖っているか、なだらかか」(=「標準偏差」の大きさで示される)と同じことを表します。

つまり、もとのデータの内容や「数値の単位」が違っていても、「分布の全体を平均値で割って規格化」したものは、「もとの分布の形を相似形のまま、平均値を1にそろえた」ものなので、そのまま「広がり」(これが「変動係数」)を比較できるということです。
特に比較ができるための「条件」などないと思います。

そういう比較ができるのが、「正規分布」の特徴ですから。
もともとの正規分布でも、「平均値 ± 標準偏差の何倍」という見方をすれば、すべて共通に扱えることは、上に挙げたリンク先のサイトに書いてある通りです。

No.1に書いたのは、そういった内容です。
    • good
    • 0

通常の正規分布は、平均値を μ、標準偏差を σ として、確率密度関数



  f(x) = 1/√(2パイσ^2) * exp[ -(x - μ)^2 / 2σ^2 ]

に従います。
https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F …

「標準偏差を平均値で規格化する」ということは、変動係数を
  A = σ/μ
とすれば

  f(x) = 1/√(2パイσ^2) * exp[ -(x - μ)^2 / 2σ^2 ]
    = μ/√[ 2パイ(σ/μ)^2 ] * exp[ -(x/μ - 1)^2 / 2(σ/μ)^2 ]
    = μ/√[ 2パイA^2 ] * exp[ -(x/μ - 1)^2 / 2A^2 ]

ですから、確率変数を「x/μ」、平均値を「1」、標準偏差を「A=σ/μ」にした正規分布であることが分かります。

従って、対象が何であっても、確率変数が何であっても、「正規分布する」という前提であれば、『平均値が 1 、標準偏差が「変動係数」』という分布だということで同じように比較できると思います。


ご質問の趣旨は、そういうことでよろしいですか?
ご質問の趣旨が違うようであれば、スルーしてください。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


おすすめ情報