なぜ正規分布の標準偏差は約６８，２６と言えるのでしょうか。

Question

なぜ正規分布の標準偏差は約６８，２６と言えるのでしょうか。
標準正規分布表がそうだから、と言えば終わりですが。
それより根本的な話で。
この値は、どうやって決める事ができたのですか？
観測による当てはめ、なのか、理論的な計算、なのか。。。。
根拠を知りたいです。
文献も教えていただけると助かります。

puyo3155 · Accepted Answer

うーん、どこから説明すべきか悩むところですが、まず、質問自体が少し間違っていて、おそらく

正規分布において、対象が、平均±標準偏差内に含まれる確率が約６８％とはなぜか？

という意味ですすめます。まず、正規分布が理解している前提でいうと、

＞正規分布の式に、＋標準偏差、－標準偏差を当てはめて、確率を計算すればそうなるから・・・・

ということになります。計算自体がわからない場合は、別途質問してください。この意味は、あることを実行すると、平均値に結構近い範囲に、７割ぐらい収まっちゃうもんだよ、ということで感覚に一致しないでしょうか？

それではその正規分布は、どう求めたかというと、大雑把にいうと、

＞平均値を持つような対象の値を、完全にランダムに発生させた場合の理論的な値を公式化したもの

なので、観測ではなく理論値になります。平均値と、標準偏差によって、山の中心と、山のなだらかさが決まるよく知られたグラフになります。

それじゃ、全ての現象が、正規分布に従うのか・・・・

＞それは違います。想定する現象が、完全にランダムで、平均値をもつような現象

という前提なので、その前提に近いような現象は、正規分布に近いと仮定して、事象を近似するのですね。よく知られた、テストの成績は、

・　平均点は、問題の難易度で、毎回変わる。
・　平均点を中心に、どれぐらいのばらつきがあるのかも、毎回変わる。
・　その２つさえ、考慮すれば、偏差値によって、その人の、相対的実力が図れるだろう。

ということで、偏差値を、合否の難易度の目安にするわけですね。実際には、厳密には正規分布に従わなかったり、昔はしたがっていたが、事象が複雑化して、従わなくなったり、利用する際には、数学的知識以上に、対象とする現象に対して、専門的な知識が必要になります。

sanori · Answer

こんにちは。

＞＞＞観測による当てはめ、なのか、理論的な計算、なのか。。。。

理論的計算です。
そして、それが（たまたま）この世の様々な分布（平均値とばらつき）に当てはめられるということです。

では、簡単な例を挙げましょう。
コイントスをして、表が出たら１点、裏が出たら－１点
そして、それを何回も続けてやったときの合計点を考えます。

１回目終了時
・１点　確率１／２
・－１点　確率１／２

２回目終了時
・２点　確率１／４
・０点　確率２／４
・－２点　確率１／４

３回目終了時
・３点　確率１／８
・１点　３／８
・－１点　３／８
・－３点　確率１／８

４回目終了時
・４点　確率１／１６
・２点　確率４／１６
・０点　確率６／１６
・－２点　確率４／１６
・－４点　確率１／１６

これらの確率は、「二項分布」で表されます。（高校で習います）
実は、これを無限回行ったときの分布が「正規分布」なのです。

当然、正規分布の標準偏差は理論的に計算できます。
そして、
平均値　±　標準偏差
の範囲に含まれる確率も理論的に計算できて、６８％となります。
「理論的」とはいっても手計算は無理なので、コンピュータにやらせます。
その結果の一覧表が正規分布表です。

＞＞＞文献も教えていただけると助かります。

非常に有名なことですので、ネット上にたくさん落ちています。

http://www.google.co.jp/search?hl=ja&q=%22%E4%BA%8C%E9%A0%85%E5%88%86%E5%B8%83%22+%22%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83%22&aq=f&aqi=g2&aql=&oq=&gs_rfai=

なお、
なぜ自然現象から人間の行動、工業製品に至るまで、様々なことが正規分布にしたがうのはなぜか？
たとえば、こういうふうに考えてください。

長さがＡの短い棒を継ぎ足して、長い棒を作るとしましょう。
ただし実際には、短い棒には、長さ　Ａ＋ｔ　のものと　Ａ－ｔ　のものがあるとします。

１本のときは、
・Ａ＋ｔ　の確率１／２
・Ａ－ｔ　の確率１／２
２本になると
・２Ａ＋２ｔ　の確率　１／４
・２Ａ　の確率　２／４
・２Ａ－２ｔ　の確率　１／４
３本になると
・３Ａ＋３ｔ　の確率　１／８
・３Ａ＋ｔ　の確率　３／８
・３Ａ－ｔ　の確率　３／８
・３Ａ－３ｔ　の確率　１／８
・・・・・

上のほうで見た、何かとそっくりだと思いませんか？

hitokotonusi · Answer

ANo２さんが書かれている通り、

標本が正規分布に従っている場合、標本中の68.26%が平均値±標準偏差の範囲に入る

が正しいですね。

＞この値は、どうやって決める事ができたのですか？

標準正規分布の確率密度関数が

φ(t)＝(1/√[2π])exp(-t^2/2)

なので、標準正規分布は平均が0、標準偏差1なので、この密度関数を-1～1で数値積分して

(1/√[2π])∫[-1 -> 1] exp(-t^2/2)dt =0.6826

を得ます。

ここでは標準正規分布を使いましたが、どんな正規分布でも平均±標準偏差の範囲で密度関数を積分すれば同じ結果になります。平均μ、標準偏差σとして、t=(x-μ)/σの変数変換をすれば、どの正規分布も標準正規分布になるので当然なんですが。

proto · Answer

＞なぜ正規分布の標準偏差は約６８，２６と言えるのでしょうか。

正規分布の標準偏差は約68.26と決まっているものではありません。
標準偏差として0以上のあらゆる値が考えられます。

正規分布と一言で言っても、平均と分散(標準偏差)を指定してはじめて分布が一つに確定するはずです。
具体的に正規分布N(μ,σ^2)は、μとσ値を決めて確率密度関数を
　　f(x) = exp(-((x-μ)^2)/(2σ^2))/(σ*√2)
と書いてはじめて確定します。
そして、この分布の標準偏差はσです。68.26とは限りません。

標準正規分布ならば標準偏差は決まっていますが、その値は68.26ではなく1です。
(標準偏差が1となるような正規分布に標準正規分布と名前を付けた)

＞この値は、どうやって決める事ができたのですか？
＞観測による当てはめ、なのか、理論的な計算、なのか。。。。

観測値から分布を推定する場合には、平均をE(x)として
　　σ^2 = (Σ{(x-E(x))^2})/(n-1)
から、不偏分散を計算します。
これはあくまでも推定値なので、計算から得られた値が妥当なのか、正規分布を仮定することが妥当なのかは別に議論する必要があります。

確率密度関数が、f(x)=exp(-((x-μ)^2)/(2σ^2))/(σ*√2)と分かっている場合には、分散の定義から
　　V = ∫[-∞,∞]{f(x)*((x-E(x))^2)}dx
を計算することで分散の値が決まり、正規分布の場合V=σ^2となります。
こちらは、「f(x)の式が与えられていれば、分散の計算式自体はそれが定義式ですから、その結果も論理的に正しい」としか言いようがありません。観測という考えが入り込む余地はありません。
ただし、観測した事象の確率密度関数をf(x)として妥当なのかどうかはしっかりと議論する必要があります。

なぜ正規分布の標準偏差は約６８，２６と言えるのでしょうか。

うーん、どこから説明すべきか悩むところですが、まず、質問自体が少し間違っていて、おそらく

こんにちは。

ANo２さんが書かれている通り、

＞なぜ正規分布の標準偏差は約６８，２６と言えるのでしょうか。

似たような質問が見つかりました

このQ&Aを見た人はこんなQ&Aも見ています

関連するカテゴリからQ&Aを探す

このQ&Aを見た人がよく見るQ&A

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング