アプリ版:「スタンプのみでお礼する」機能のリリースについて

自由度3以上のカイ自乗分布が、自由度1,2の場合と
異なった傾向のグラフになる理由がよくわかりません。

数式の説明ではなくて、直感的な説明がありましたら、教えてください。
(特に、自由度3以上は、0をとる確率が0になることについて)

A 回答 (2件)

直感的に、というと難しいですが、やってみましょう。



まず自由度nのχ^2分布は
x = x1^2 + ... + xn^2
になっています。x1,...,xn はそれぞれ独立な、標準正規分布に従う確率変数です。二乗和ですのでそれぞれの項は非負になりますから、x=0 となるのは x1=...=xn=0 となっているときであることが分かります。逆に言えば、一つでも0でない物があれば x は0になりません。しかも、x1,...,xn は標準正規分布に従っているので、絶対値をとって平均を取れば1になります。従って、二乗すれば1より小さいものは0により近付きますから、n=1では0付近が厚くなります。
n=2でも同じ理屈で0付近が厚くなりますが、今度は2つが0に近い数値をとる必要があるので、その分だけ確率が小さくなってしまいます。
ところがn=3となれば、その内一つも大きい値が出ない確率が非常に小さくなるため、0付近が薄くなり、0の時に0になります。

この回答への補足

>ところがn=3となれば、その内一つも大きい値が出ない確率が非常に小さくなるため、0付近が薄くなり、0の時に0になります。

という点がいまいち理解できません。Nがおおきくなるにつれて徐々に小さくなっていくのならわかるのですが、グラフをみると振舞いがガラっとかわってしまってしまうのがわかりません。
なにか理解の助けとなる助言等ありましたら、よろしくおねがいします

補足日時:2005/07/08 13:49
    • good
    • 0
この回答へのお礼

ありがとうございました。
これからもよろしくおねがいします。

お礼日時:2005/07/08 13:49

> 数式の説明ではなくて、直感的な説明がありましたら、教えてください。



とのことですが、多少数式を使って説明させていただきます。

#1 さんの回答では違いが出るのが自由度 2 と 3 の間である理由が説明できません。なぜ 3 と 4 の間ではないのか、4 と 5 の間ではないのか、ということになりますね。またχ2分布の自由度は自然数に限りませんし、「違い」というなら、自由度 1 と 2 の間でも違います。 x → 0 で関数の値は、自由度 1 では ∞に発散しますが、自由度 2 では有限です。
これについては直感的に理解できる理由というのはないように思います。これは、χ2分布関数の x に関するべき乗項が、x ^ ( n/2 - 1 ) となっており( n は自由度)、この項がご質問で問題になっている関数の挙動を左右しています。即ち、 n < 2 ではこの項は x → 0 で発散し、n = 2 で定数に、 n > 2 では x → 0 で 0 になるためで、2 という値を境にしているのは結局 n/2 の分母が 2 であるからという理由以外の何者でもありません。この 2 に直感的意味付けは難しいように思います。


それに、

> (特に、自由度3以上は、0をとる確率が0になることについて)

という記述から察すると、おそらく誤解なさっていると思いますが、χ2分布は確率密度関数なので、関数の値が確率を示すわけではありません(念のために申し上げれば、χ2分布の確率密度関数は、x ≦ 0 では 0 と定義されますので、自由度 3 未満でも x = 0 で 0 です)。確率密度関数を積分して初めて確率になります。即ち、 x が a から b の間の値をとる確率は、

Prob ( a ≦ x ≦ b ) = ∫χ2 ( x ) dx  (積分区間は x = a から x = b まで)

となります。連続分布の場合 x が特定の値をとる確率は、上式で積分区間の下限と上限が一致することになり、常に 0 ですが、これは実数の連続性を考えれば当然です。

確率として考えるには、χ2分布の分布関数 F( t )

F( t ) = Prob ( 0 ≦ x ≦ t ) = ∫χ2 ( x ) dx (積分区間は x = 0 から x = t まで)

即ち、x が t 以下の値をとる確率を t の関数として表したもの、を使いますが、この関数は自由度によらず t = 0 で 0 をとり、t → ∞ で 1 に漸近する単調増加関数になります。関数曲線は自由度の違いによって滑らかな変化をし、密度関数のような不連続性を示しません。
これは Excel の chidist() 関数を使ってグラフを描いてみると確かめられると思いますので、 Excel が利用できるなら試してみるとよいと思います。 1 - chidist( x, df ) が、自由度 df の分布関数の x における値になります。

したがって自由度による確率分布の変化という意味では、ご質問にあるような自由度 1, 2 と 3 以上で、異なる傾向を示さないのです。

この回答への補足

勉強不足でごめんなさい。御指摘ありがとうごさいます。
EXCELで確かめてみました。なるほど分布関数をみると定性的な振舞いは変化しないのですね! 勉強になります。

>x に関するべき乗項が、x ^ ( n/2 - 1 ) となっており(続く)

やはり、こういう理解以外は難しいのでしょうか。なにかコメントある方お願いします。

補足日時:2005/07/08 13:52
    • good
    • 0
この回答へのお礼

たいへん勉強になりました。ありがとうございました。
これからもよろしくお願いします

お礼日時:2005/07/08 14:04

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!