母分散の区間推定について

解決済

質問者：hecunhehui
質問日時：2021/08/19 20:22
回答数：25件

母分散の区間推定で求めた結果のルートをとり、標準偏差にすることは、してもよいことなのでしょうか？

カイ二乗分布は分散の分布であって、標準偏差の分布ではないと思うので気になっています。

数学的厳密性においてはルートをとることは間違いだが、実用上問題ないとか、

よく実社会においてはルートをとり標準偏差に戻すことはよく行われており、この程度のリスクがあるなど、

何らかのコメントを頂ければと思います。

関連する内容でもうひとつの質問ですが、

母集団からサンプルを抽出し、標準偏差を求めることを何度も繰り返すと、

標準偏差の平均値と、標準偏差の分布が見えてくると思います。

それをもって標準偏差の区間推定としてはいけないのでしょうか？

数学が全然できず、優しい回答頂ければ幸いです。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (25件中21～25件)

ベストアンサー優先
最新から表示
回答順に表示

No.5

回答者： kamiyasiro
回答日時：2021/08/20 03:44

#2です。

私、ご質問の意図を誤解していました。すみません。

①サンプルの不偏分散の平方根の期待値は偏っていますが、
②サンプルの不偏分散の期待値（これは正しい推定値です）の平方根は点推定値として正しいです。

というご指摘ですね。ごもっともです。

つまり、
①var(x)の平方根を求めることを何度も繰り返したときの平均と
②var(x)を求めることを何度も繰り返したときの平均の平方根は
値が異なります。

②は#3さんのご指摘どおり正しい推定を行います。
①はそれよりも小さい値となります。

- 0
- 件

通報する

No.4

回答者： kamiyasiro
回答日時：2021/08/20 03:01

#2です。

#3さん、ご指摘、ありがとうございます。

「サンプル」から母標準偏差を推定するとき、その期待値には偏りがある、ということです。「全数データ」を使う時は、回帰分析の信頼区間のごとくOKです。

・「サンプル」の分散（不偏分散）を使って、母集団の分散の信頼区間を推定するまではOKですが、

・その推定した母分散の信頼区間の値から標準偏差の信頼区間を算出することはNGです。平方根を取った時点でNGなのです。

・ただし、サンプルサイズが大きい時は、その差は僅かですし、正規分布近似ができます。それは、不偏と不偏じゃない分散の値が漸近してくるからです。

どの統計の本を見ても、「標準偏差の信頼区間」に言及していることは、ほぼありません。たまに新世代の人がやっちゃた、ということはあると思います。（そもそも（nー1）で割るということをやらない新世代がいますから。学校教育が矛盾しています）

私は60歳過ぎていますが、先の投稿にも書いたように、品質管理関係の旧JISには明確に書いてあり、企業内教育でも習ったし、サンプルサイズ≦５の時の標準偏差は、分散の平方根で求めずレンジ／d2で求めるということが、社内基準になっています。

これは、1960年代にQCを導入した会社であれば普通だと思います。管理図（日科技連かどこかが作成した標準的なもの）の欄外に「不偏化定数」を使った方法が明示してあるからです。

「不偏化定数」でググると、この偏りについて解説している記事が見つかると思います。「不偏化定数」があるってことは、偏っているということなんですが、世間での認識は薄いようです。

- 0
- 件

通報する

No.3

回答者： yhr2
回答日時：2021/08/20 00:18

No.1 です。

回答者間のやりとりはちょっとなんですが、#2 さんの回答に対して確認したいことがあります。

確かに「サンプルの標準偏差を使って、母集団の標準偏差を推定する」のはNGかと思います。

そうではなく、「サンプルの分散を使って、母集団の分散の信頼区間を推定し、その推定した母分散から母標準偏差を算出する」場合もNGでしょうか？

- 0
- 件

通報する

No.2

回答者： kamiyasiro
回答日時：2021/08/19 21:34

企業で統計を推進する立場の者です。

ダメです。区間推定できるのは分散だけです。

不偏分散 V の平方根 s は厳密には標準偏差 σ の不偏推定量ではありません（1999年のJISでは明記されていました。にもかかわらず、2015年のJISでは、「標本標準偏差はばらつきの指標である」という曖昧な表現になりました）。

よって、標準偏差の区間推定はやってはダメです。
その理由を実際に試行して示します。

①まず、N(0,1^2)の正規乱数を大量に発生させて（例えば10万個）、まず、μ＝0、σ＝１を確認します。省略します。

②そこから、ｎ＝5のサンプリングを行って標準偏差を求めることを1万回試行します。

③そのヒストグラムを描いてみると分布はいびつになります。その結果が下記です。「その期待値は１より小さく、大きい側にすそ野を引く分布形」になります。この形状はサンプルサイズで異なります。

なお、これを補正するのが「不偏化定数」で、d2、c4などの値があります。QC関係者は知っている話です。

- 0
- 件

通報する

No.1

回答者： yhr2
回答日時：2021/08/19 21:04

母分散の区間推定が

　A < σ^2 < B
となったときに
　√A < σ < √B
としてよいか、ということですか？

「分散」と「標準偏差」の関係はそういうものですから、全く問題ないと思います。

＞標準偏差の平均値と、標準偏差の分布が見えてくると思います。
＞それをもって標準偏差の区間推定としてはいけないのでしょうか？

サンプル分散（あるいは標準偏差）の分布ということですね？
おっしゃるとおり、サンプル分散（あるいは標準偏差）の「ばらつき」が小さくなります。
その「数を増やしたサンプル」で母分散を推定すれば、少ないサンプルのときよりも「小さい範囲」「狭い区間」の結果が得られると思います。

でも、それは、最初考えた「サンプルサイズ n のサンプルの分散の分布」が「自由度 (n - 1) のカイ2乗分布」だったものが、サンプル群を N 個採って来ることによって「自由度 (Nn - 1) のカイ2乗分布」に変わったということです。
なので、「サンプルサイズを大きくした」ときの区間推定と同じことになります。
結局「サンプルサイズ n のサンプルをN個」採って来ても、「サンプルサイズ N×n のサンプルを１個」採って来ても、推定結果は同じことになります。