アプリ版:「スタンプのみでお礼する」機能のリリースについて

QQプロットに関して質問です。

QQプロットでデータが正規分布にしたがっていると
データが直線に並ぶのはなぜですか?

わかる方がいらっしゃいましたら
教えていただきたいです。
よろしくお願いします。

A 回答 (3件)

#2に修正漏れがあったので訂正。


変数変換後の積分範囲は0から1です。
    • good
    • 0

以下は標準正規分布を例にしていますが、他の分布でも同様です。


標準正規分布の確率密度関数をφ(x)、分布関数をΦ(x)とおくと、大きさnの無作為標本の小さい方から数えてk番目の確率変数X_kの確率密度関数f(x_k)は、
f(x_k) = {n!/((k-1)!(n-k)!)} {Φ(x_k)}^(k-1) {1-Φ(x_k)}^(n-k) φ(x)
となります。

横軸にk/(n+1)、縦軸にΦ(x_k)をプロットした図がP-Pプロットとなります。
ここで、Φ(x_k)の期待値を求めてみると、
E[Φ(x_k)] = ∫_{-∞}^∞ Φ(x_k) f(x_k) dx_k
= ∫_{-∞}^∞ {n!/((k-1)!(n-k)!)} u^k (1-u)^(n-k) du (u=Φ(x_k)で変数変換した)
= {n!/((k-1)!(n-k)!)} Beta(k+1, n-k+1) (Betaはベータ関数)
= {n!/((k-1)!(n-k)!)} {k!(n-k)!/(n+1)!}
= k/(n+1)
となることから、P-Pプロットは期待値を考えると直線になることがわかります。
実際、
E[{Φ(x_k)}^2] = ∫_{-∞}^∞ {Φ(x_k)}^2 f(x_k) dx_k
= ∫_{-∞}^∞ {n!/((k-1)!(n-k)!)} u^(k+1) (1-u)^(n-k) du
= {n!/((k-1)!(n-k)!)} Beta(k+2, n-k+1)
= {n!/((k-1)!(n-k)!)} {(k+1)!(n-k)!/(n+2)!}
= (k+1)k/{(n+2)(n+1)}
から
V[Φ(x_k)] = (k+1)k/{(n+2)(n+1)}-{k/(n+1)}^2
= k(n-k+1)/(n+2)(n+1)^2
であることから、n→∞のときΦ(x_k)はk/(n+1)に一致します。
ちなみに、ここでは横軸をk/(n+1)としましたが、これ以外の方法もあります。

一方、横軸にφ^(-1)(k/(n+1))、縦軸にx_kをプロットしたのが、ご質問のQ-Qプロットとなります。
nが十分大きければ、k/(n+1)≒Φ(x_k)になるのだから、逆変換してもΦ^(-1)(k/(n+1))≒x_kとなります。
したがって、こちらも直線になることが期待されます。
    • good
    • 0

累積正規分布(標準正規分布のヒストグラムを積分したもの)をヨコ軸、正規化したデータの累積分布(データを平均0、標準偏差1になるように変換したもののヒストグラムを積分したもの)を縦軸にしてプロットしてるんです。


もし正規化したデータが標準正規分布に従っていれば、縦軸yと横軸xは同じなんだから、プロットはy=xのグラフになって、つまりナナメ45度の直線になる。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!