統計学や数学の知識が乏しい文系人間です。
必要あって工学分野の論文を読んでいたところ,「データが対数正規分布となっており,標準偏差は○○である」という文章が出てきました。
ネットで調べると,対数正規分布とは、ある変数の対数をとるとその値が正規分布に従うような分布をいう,とありました。また,正規分布の場合,平均値をμ,標準偏差をσとすると,μ±σの範囲内に約68%のデータが分布し,μ±2σの範囲内に約95%のデータが分布するとありました。
正規分布するデータの度数分布グラフは,左右対称の釣り鐘型ですが,対数正規分布するデータの度数分布グラフは,左右対称ではなく,左側が急で右側がなだらかになっています。
教えていただきたいのは,データが対数正規分布している場合も,μ±σの範囲内に約68%のデータが分布し,μ±2σの範囲内に約95%のデータが分布するといえるのか,ということです。
よろしくお願いします。
No.1ベストアンサー
- 回答日時:
<データが対数正規分布している場合も,μ±σの範囲内に
約68%のデータが分布し,μ±2σの範囲内に約95%の
データが分布するといえるのか?>
というご質問と思いますが、そう単純ではありません。
対数正規分布はWikiによれば次の様なものです。
<対数正規分布は、連続確率分布の一種で、この分布に従う
確率変数の対数をとったとき、対応する分布が正規分布になる。>
つまり、確立変数をXとした時に、その対数logXを取り、それを
横軸として、頻度を描くと、その形が正規分布になる様な分布です。
確立変数Xを変換した物は、それ自体は具体的な意味を失います。
対数正規分布の例としては、所得分布が知られています。
所得ゼロから始まり、平均所得付近で最大値をとり、高額所得者
の方に減少しながら伸びて行く曲線です。横軸が所得金額、縦軸が
その所得の人の人数です。所得100万円の意味は明確ですが、
Log(100万円)又はlog100(万円)とは何でしょうか?
範囲の話を説明する為に、均一な分布の例をあげます。
確立変数X は 0≦X≦3 で定義され、その間の頻度は同一と
します。数式的には、確率密度関数f(X)は
f(X) = 1/3 0≦X≦3 で与えられます。
これを積分してみます
∫f(X)dX =1/3* [X]0-3 = 1 で確かにf(X) は確率密度関数です。
ここで、変数X を変数Y = X^2 に変換した場合の確率密度関数f’(X)
を考えてみます。
f’(X) = 2/9* X 0≦X≦9 となります。
これを積分してみます
∫f’(X)dX =2/9* [X^2/2]0-9 = 1 で確かにf(X) は確率密度関数です。
f’(X) のXの中央値を 9/2 とし、その中央値から±9/4の範囲を考えて
見ます。この範囲が、X^2 ⇒ X に戻したf(X) ではどういう範囲に
なるでしょうか?
中央値9/2 – 9/4 の範囲の面積は√をとって、1/3 を掛ければ0.2071。
中央値9/2 + 9/4 の範囲の面積は√をとって、1/3 を掛ければ0.1589。
つまり、変換前は対称な範囲も、変換後は非対称な範囲になって
います。
f(X) が対数正規分布で、変換X→X^2がlogX、f’(X) が正規分布の
場合は話はより複雑に成ります。
しかし、対数正規分布と正規分布のそれぞれの範囲を単純に同じと
考えてはいけない事は解っていただけると思います。
<標準偏差は○○である>と言う記述が有る場合には、f(X)の標準
偏差と思います。f’(X)の分散は平均値μと標準偏差σの関数です。
https://ja.wikipedia.org/wiki/%E5%AF%BE%E6%95%B0 …
丁寧に具体的に教えていただきありがとうございました。
対数正規分布のデータの分布状況と正規分布のデータの分布状況を同じと考えてはいけないということがわかり,大変助かりました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・人生のプチ美学を教えてください!!
- ・10秒目をつむったら…
- ・あなたの習慣について教えてください!!
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・【大喜利】【投稿~9/18】 おとぎ話『桃太郎』の知られざるエピソード
- ・街中で見かけて「グッときた人」の思い出
- ・「一気に最後まで読んだ」本、教えて下さい!
- ・幼稚園時代「何組」でしたか?
- ・激凹みから立ち直る方法
- ・1つだけ過去を変えられるとしたら?
- ・【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集
- ・【あるあるbot連動企画】フォロワー20万人のアカウントであなたのあるあるを披露してみませんか?
- ・映画のエンドロール観る派?観ない派?
- ・海外旅行から帰ってきたら、まず何を食べる?
- ・誕生日にもらった意外なもの
- ・天使と悪魔選手権
- ・ちょっと先の未来クイズ第2問
- ・【大喜利】【投稿~9/7】 ロボットの住む世界で流行ってる罰ゲームとは?
- ・推しミネラルウォーターはありますか?
- ・都道府県穴埋めゲーム
- ・この人頭いいなと思ったエピソード
- ・準・究極の選択
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
エクセルのグラフから半値幅を...
-
下の対数表示のグラフから低域...
-
心理学の統計について
-
統計について
-
卒論でアンケート結果を引用す...
-
数Ⅲの問題です 数直線上を運動...
-
エクセルの統計でχ二乗検定の結...
-
極値をもつ時と持たない時、単...
-
検量線の決定係数について
-
EXCELにてローパスフィルタを作...
-
パイロットサンプルって何ですか?
-
自由度(1,m)のF値は自由度mのt...
-
エクセル統計のランク化した数...
-
検定統計量の値がマイナス
-
卒業論文のアンケートの数について
-
相関係数0.27は非常に弱い正の...
-
【統計】T検定の有意確率
-
【統計】有意に「高い」?「低...
-
「Zスコア」や「Z検定」の「Z」...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
カイ二乗検定
-
エクセルのグラフから半値幅を...
-
統計について
-
検量線の決定係数について
-
3群の比較にχ二乗検定を使う場...
-
【統計】有意に「高い」?「低...
-
エクセルの統計でχ二乗検定の結...
-
ノンパラメトリック検定の多重...
-
パーセンテージの平均値2標本の...
-
パイロットサンプルって何ですか?
-
二次関数の問題です 二次関数 y...
-
理科のグラフで、直線と曲線の...
-
心理機能診断をしたのですが、...
-
アンケートの集計分析の基礎(...
-
変化率のみで、有意差の検定は...
-
検定統計量の値がマイナス
-
極値をもつ時と持たない時、単...
-
最小二乗法を反比例の式を元に...
おすすめ情報