詳しい人求む！

Pythonのspicy.stats.norm.interval()の引数scaleの使い方

解決済

質問者：tmiyoshi
質問日時：2024/07/30 11:08
回答数：1件

Pythonのspicy.stats.norm.interval()の引数scaleの使い方についての質問です。
データの標準偏差を
predict_std = np.std(daya, ddof=1)の普遍標準偏差で求めた場合、
n=len(data)として、
spicy.stats.norm.interval()の引数scaleは、scale=predict_std/np.sqrt(n)として、
predict_stdをnp.sqrt(n)で除算して使っているようなのですが、ここは何故、標準偏差を
np.sqrt(n)で割る必要があるのでしょうか？
区間推定について詳しい方、教えてください。

通報する

この質問への回答は締め切られました。

質問の本文を隠す

回答 (1件)

ベストアンサー優先
最新から表示
回答順に表示

No.1ベストアンサー

回答者： kamiyasiro
回答日時：2024/07/30 12:09

実施しようとしているのが、平均値の差の検定だからです。

母集団からｎ個サンプリングして平均値を取るという操作を、何度も何度も繰り返すと、その平均値の分布は、N(μ，(σ／√n)^2)という分布になります。

つまり、母集団の標準偏差をσとすると、平均値の分布の標準偏差は、σ／√ｎになるのです。

～～～～～～～～～～～～～～～～～～～～～～～～～～

ちなみに、不偏標準偏差ではありません。不偏分散の平方根と言いましょう。（標本標準偏差に対して）単に標準偏差でも良いです。

不偏標準偏差は実際にはあるのですが、ガンマ関数を用いた複雑な式です。
不偏分散の平方根は、残念ながら小さい側に偏っています。