幼稚園時代「何組」でしたか?

統計学や数学の知識が乏しい文系人間です。
必要あって工学分野の論文を読んでいたところ,「データが対数正規分布となっており,標準偏差は○○である」という文章が出てきました。
ネットで調べると,対数正規分布とは、ある変数の対数をとるとその値が正規分布に従うような分布をいう,とありました。また,正規分布の場合,平均値をμ,標準偏差をσとすると,μ±σの範囲内に約68%のデータが分布し,μ±2σの範囲内に約95%のデータが分布するとありました。
正規分布するデータの度数分布グラフは,左右対称の釣り鐘型ですが,対数正規分布するデータの度数分布グラフは,左右対称ではなく,左側が急で右側がなだらかになっています。
教えていただきたいのは,データが対数正規分布している場合も,μ±σの範囲内に約68%のデータが分布し,μ±2σの範囲内に約95%のデータが分布するといえるのか,ということです。
よろしくお願いします。

A 回答 (1件)

<データが対数正規分布している場合も,μ±σの範囲内に


約68%のデータが分布し,μ±2σの範囲内に約95%の
データが分布するといえるのか?>
というご質問と思いますが、そう単純ではありません。

対数正規分布はWikiによれば次の様なものです。
<対数正規分布は、連続確率分布の一種で、この分布に従う
確率変数の対数をとったとき、対応する分布が正規分布になる。>
つまり、確立変数をXとした時に、その対数logXを取り、それを
横軸として、頻度を描くと、その形が正規分布になる様な分布です。
確立変数Xを変換した物は、それ自体は具体的な意味を失います。
対数正規分布の例としては、所得分布が知られています。
所得ゼロから始まり、平均所得付近で最大値をとり、高額所得者
の方に減少しながら伸びて行く曲線です。横軸が所得金額、縦軸が
その所得の人の人数です。所得100万円の意味は明確ですが、
Log(100万円)又はlog100(万円)とは何でしょうか?

範囲の話を説明する為に、均一な分布の例をあげます。
確立変数X は 0≦X≦3 で定義され、その間の頻度は同一と
します。数式的には、確率密度関数f(X)は
f(X) = 1/3 0≦X≦3 で与えられます。
これを積分してみます
∫f(X)dX =1/3* [X]0-3 = 1 で確かにf(X) は確率密度関数です。
ここで、変数X を変数Y = X^2 に変換した場合の確率密度関数f’(X)
を考えてみます。
f’(X) = 2/9* X 0≦X≦9 となります。
これを積分してみます
∫f’(X)dX =2/9* [X^2/2]0-9 = 1 で確かにf(X) は確率密度関数です。

f’(X) のXの中央値を 9/2 とし、その中央値から±9/4の範囲を考えて
見ます。この範囲が、X^2 ⇒ X に戻したf(X) ではどういう範囲に
なるでしょうか?
中央値9/2 – 9/4 の範囲の面積は√をとって、1/3 を掛ければ0.2071。
中央値9/2 + 9/4 の範囲の面積は√をとって、1/3 を掛ければ0.1589。
つまり、変換前は対称な範囲も、変換後は非対称な範囲になって
います。

f(X) が対数正規分布で、変換X→X^2がlogX、f’(X) が正規分布の
場合は話はより複雑に成ります。
しかし、対数正規分布と正規分布のそれぞれの範囲を単純に同じと
考えてはいけない事は解っていただけると思います。
<標準偏差は○○である>と言う記述が有る場合には、f(X)の標準
偏差と思います。f’(X)の分散は平均値μと標準偏差σの関数です。

https://ja.wikipedia.org/wiki/%E5%AF%BE%E6%95%B0 …
    • good
    • 2
この回答へのお礼

丁寧に具体的に教えていただきありがとうございました。
対数正規分布のデータの分布状況と正規分布のデータの分布状況を同じと考えてはいけないということがわかり,大変助かりました。

お礼日時:2016/02/22 21:11

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!