アプリ版:「スタンプのみでお礼する」機能のリリースについて

信頼区間を求める方法として、「標準正規分布では値が1.96以上の曲線下の面積と、-1.96以下の面積を合計すると0.05である。そこで平均から標準誤差SEに1.96の値をかけ算した値を引いた値と足した値の範囲に真の値が含まれるはずと言うことになる。これを95%信頼区間という」と本に記載されていました。母集団が少なく、正規分布していないであろうと思われるサンプルであっても、この方法に従い信頼区間を算出することは適切でしょうか?
具体的には以下の2群のそれぞれについて95%信頼区間を知りたいのです。
統計については素人なので的はずれな質問かも知れません。
X
209.1
280
91
124
80.57884211
67
152.2
88.584
138.0215385
112.43
115.71
97
128
144

Y
145.035
113.2352941
143.5
117.25
62
78
58
79.5
68.49975
73.85728571
81.61222222
190.5
58
179.25
84
76.6665
168.92
76.76

A 回答 (2件)

信頼区間を求めるとき、分布を仮定することは重要なことです。


標本が正規分布に従っていると思われるときには、正規分布に従うなりの方法を適用しますし、そうでなければ別の分布の場合にしたがって区間を求めることになります。
正規分布ではないらしいことがわかっているのに、正規分布を仮定して話を進めるのは正に見当違いといったところでしょう。

標本がどのような分布に従うかわかる場合には、それに合った方法をとることをお勧めします。

標本がどのような分布に従うかわからない場合でも、分布によらない方法・ノンパラメトリックな方法も研究されています。
そちらも検討してみてください。

参考URL:http://aoki2.si.gunma-u.ac.jp/lecture/Kentei/non …

この回答への補足

早速、ご回答いただきありがとうございます。
確かに正規分布ではないらしいことがわかっているのに、正規分布を仮定して話を進めるのは正しい方法とは言えないと思います。

2群間での比較をしたいのであればノンパラで行うところなのですが、あくまでそれぞれの信頼区間を算出したいのです。
正規分布に従わない母集団で信頼区間を算出する方法はあるのでしょうか?
あるとすればその方法と結果を教えていただければと思います。
宜しくお願いします。

補足日時:2007/09/18 20:42
    • good
    • 0

通常用いられる区間推定法は、標本が正規分布に従うことを仮定していますので、#1さんの仰られている様に、標本が正規分布に従っていると見なせる場合しか使えません。


データのヒストグラムや統計的性質、そもそもの観測対象の性質を勘案して最適な標本分布のモデルを作り、両側5%点を計算することになるのでしょうか。

と言っても処方箋がないと困るでしょうから、私がこのデータをもらって信頼区間を推定せよ、と言われたらどうするか、という視点で以下私見を述べさせていただきます。

まずはヒストグラムを描いて、正規分布が当てはまりそうか目で確認します。統計的にきちんとやるなら、正規性の検定(#1の方の参考URLにある1標本Kolmogorov-Smilnov検定など)を行うのでしょうが、ここは簡便にいきます。
実際にヒストグラムを描くと(Excelで簡単に描けます)、ピークの右に裾を引いた非対称な分布になっており、正規分布は当てはまりそうにありません。
右裾の厚い非対称な分布の候補としては、対数正規分布やΓ-分布が代表的なので、これらを検討することになると思います。
特に、対数正規分布を仮定すれば、通常の区間推定法を使える(標本の対数を取って、それが正規分布に従うとすれば良い)ので、真先に検討することになるでしょう。
また一定値(50?)以下は取らないような標本にも思えますが、もしそうなら、その閾値を引いた値に対して、上記の分布を当てはめることになるでしょう。

以上です。
もっとも、これはあくまで与えられたデータだけに基づく考察であり、観測対象の理解とモデル化から始めるのが本来であろうと思います。観測対象の詳細が分かれば、より妥当なモデル化の方法があるかもしれません。
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!