母分散の区間推定で求めた結果のルートをとり、標準偏差にすることは、してもよいことなのでしょうか?
カイ二乗分布は分散の分布であって、標準偏差の分布ではないと思うので気になっています。
数学的厳密性においてはルートをとることは間違いだが、実用上問題ないとか、
よく実社会においてはルートをとり標準偏差に戻すことはよく行われており、この程度のリスクがあるなど、
何らかのコメントを頂ければと思います。
関連する内容でもうひとつの質問ですが、
母集団からサンプルを抽出し、標準偏差を求めることを何度も繰り返すと、
標準偏差の平均値と、標準偏差の分布が見えてくると思います。
それをもって標準偏差の区間推定としてはいけないのでしょうか?
数学が全然できず、優しい回答頂ければ幸いです。
No.5
- 回答日時:
#2です。
私、ご質問の意図を誤解していました。すみません。
①サンプルの不偏分散の平方根の期待値は偏っていますが、
②サンプルの不偏分散の期待値(これは正しい推定値です)の平方根は点推定値として正しいです。
というご指摘ですね。ごもっともです。
つまり、
①var(x)の平方根を求めることを何度も繰り返したときの平均と
②var(x)を求めることを何度も繰り返したときの平均の平方根は
値が異なります。
②は#3さんのご指摘どおり正しい推定を行います。
①はそれよりも小さい値となります。
No.4
- 回答日時:
#2です。
#3さん、ご指摘、ありがとうございます。
「サンプル」から母標準偏差を推定するとき、その期待値には偏りがある、ということです。「全数データ」を使う時は、回帰分析の信頼区間のごとくOKです。
・「サンプル」の分散(不偏分散)を使って、母集団の分散の信頼区間を推定するまではOKですが、
・その推定した母分散の信頼区間の値から標準偏差の信頼区間を算出することはNGです。平方根を取った時点でNGなのです。
・ただし、サンプルサイズが大きい時は、その差は僅かですし、正規分布近似ができます。それは、不偏と不偏じゃない分散の値が漸近してくるからです。
どの統計の本を見ても、「標準偏差の信頼区間」に言及していることは、ほぼありません。たまに新世代の人がやっちゃた、ということはあると思います。(そもそも(nー1)で割るということをやらない新世代がいますから。学校教育が矛盾しています)
私は60歳過ぎていますが、先の投稿にも書いたように、品質管理関係の旧JISには明確に書いてあり、企業内教育でも習ったし、サンプルサイズ≦5の時の標準偏差は、分散の平方根で求めずレンジ/d2で求めるということが、社内基準になっています。
これは、1960年代にQCを導入した会社であれば普通だと思います。管理図(日科技連かどこかが作成した標準的なもの)の欄外に「不偏化定数」を使った方法が明示してあるからです。
「不偏化定数」でググると、この偏りについて解説している記事が見つかると思います。「不偏化定数」があるってことは、偏っているということなんですが、世間での認識は薄いようです。
No.3
- 回答日時:
No.1 です。
回答者間のやりとりはちょっとなんですが、#2 さんの回答に対して確認したいことがあります。確かに「サンプルの標準偏差を使って、母集団の標準偏差を推定する」のはNGかと思います。
そうではなく、「サンプルの分散を使って、母集団の分散の信頼区間を推定し、その推定した母分散から母標準偏差を算出する」場合もNGでしょうか?
No.2
- 回答日時:
企業で統計を推進する立場の者です。
ダメです。区間推定できるのは分散だけです。
不偏分散 V の平方根 s は厳密には標準偏差 σ の不偏推定量ではありません(1999年のJISでは明記されていました。にもかかわらず、2015年のJISでは、「標本標準偏差はばらつきの指標である」という曖昧な表現になりました)。
よって、標準偏差の区間推定はやってはダメです。
その理由を実際に試行して示します。
①まず、N(0,1^2)の正規乱数を大量に発生させて(例えば10万個)、まず、μ=0、σ=1を確認します。省略します。
②そこから、n=5のサンプリングを行って標準偏差を求めることを1万回試行します。
③そのヒストグラムを描いてみると分布はいびつになります。その結果が下記です。「その期待値は1より小さく、大きい側にすそ野を引く分布形」になります。この形状はサンプルサイズで異なります。
なお、これを補正するのが「不偏化定数」で、d2、c4などの値があります。QC関係者は知っている話です。
No.1
- 回答日時:
母分散の区間推定が
A < σ^2 < B
となったときに
√A < σ < √B
としてよいか、ということですか?
「分散」と「標準偏差」の関係はそういうものですから、全く問題ないと思います。
>標準偏差の平均値と、標準偏差の分布が見えてくると思います。
>それをもって標準偏差の区間推定としてはいけないのでしょうか?
サンプル分散(あるいは標準偏差)の分布ということですね?
おっしゃるとおり、サンプル分散(あるいは標準偏差)の「ばらつき」が小さくなります。
その「数を増やしたサンプル」で母分散を推定すれば、少ないサンプルのときよりも「小さい範囲」「狭い区間」の結果が得られると思います。
でも、それは、最初考えた「サンプルサイズ n のサンプルの分散の分布」が「自由度 (n - 1) のカイ2乗分布」だったものが、サンプル群を N 個採って来ることによって「自由度 (Nn - 1) のカイ2乗分布」に変わったということです。
なので、「サンプルサイズを大きくした」ときの区間推定と同じことになります。
結局「サンプルサイズ n のサンプルをN個」採って来ても、「サンプルサイズ N×n のサンプルを1個」採って来ても、推定結果は同じことになります。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 以下の問題が分からないので計算式を教えてください ある企業が製造している電球の寿命の母平均と,母標準 3 2023/01/14 00:43
- 統計学 統計学についての質問です。 2標本問題で A: サイズ32 平均62.2 標準偏差11.0 B: サ 2 2023/02/08 14:15
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 数学 この問題の右ページの分散を求めるときなんですけど、平均点の方は前の平均が71なので(新)=71✖️0 3 2022/06/10 23:02
- 統計学 生物統計学の質問 7 2022/05/17 13:59
- 統計学 ある会社の製品全体の質量mを推定したい。その製品をn個無作為に選んで測ったところn個の平均はm0であ 3 2022/07/29 12:18
- 統計学 直線の傾き(回帰係数)から相関係数を計算できるのでしょうか? 2 2022/09/16 19:28
- 統計学 確率統計の問題です。 4 2022/07/26 23:37
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
首吊りどこ締めるの
-
白血球が多いとどんな心配があ...
-
至急!尿検査前日にオナニーし...
-
検便についてです。 便は取れた...
-
彼女のことが好きすぎて彼女の...
-
尿検査の前日は自慰控えたほう...
-
EXCELで条件付き書式で空白セル...
-
腕を見たら黄色くなってる部分...
-
2つの数値のうち、数値が小さい...
-
勃起する時って痛いんですか? ...
-
EXCELで式からグラフを描くには?
-
精子が黄色?
-
飽和演算、ラップアラウンド演...
-
値が入っている一番右のセル位...
-
尿検査前日に自慰行為した時の...
-
リンク先のファイルを開かなく...
-
エクセル指定した範囲からラン...
-
excelでsin二乗のやり方を教え...
-
これって喉仏ですか? 私は女性...
-
口の中に黒い血の塊
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
至急!尿検査前日にオナニーし...
-
首吊りどこ締めるの
-
尿検査の前日は自慰控えたほう...
-
尿検査前日に自慰行為した時の...
-
検便についてです。 便は取れた...
-
白血球が多いとどんな心配があ...
-
中出しをするとお腹が痛い・・・。
-
射精をして1週間以内に尿検査を...
-
彼女のことが好きすぎて彼女の...
-
腕を見たら黄色くなってる部分...
-
勃起する時って痛いんですか? ...
-
変な話しになります。尿検査で...
-
これって喉仏ですか? 私は女性...
-
EXCELで条件付き書式で空白セル...
-
男です。昨日の午後3時くらいに...
-
今朝、毎朝の習慣でオナニーし...
-
納豆食べた後の尿の納豆臭は何故?
-
1日前の検尿
-
値が入っているときだけ計算結...
-
精子が黄色?
おすすめ情報