一回も披露したことのない豆知識

Pythonのspicy.stats.norm.interval()の引数scaleの使い方についての質問です。
データの標準偏差を
predict_std = np.std(daya, ddof=1)の普遍標準偏差で求めた場合、
n=len(data)として、
spicy.stats.norm.interval()の引数scaleは、scale=predict_std/np.sqrt(n)として、
predict_stdをnp.sqrt(n)で除算して使っているようなのですが、ここは何故、標準偏差を
np.sqrt(n)で割る必要があるのでしょうか?
区間推定について詳しい方、教えてください。

  • 画像を添付する (ファイルサイズ:10MB以内、ファイル形式:JPG/GIF/PNG)
  • 今の自分の気分スタンプを選ぼう!
あと4000文字

A 回答 (1件)

実施しようとしているのが、平均値の差の検定だからです。



母集団からn個サンプリングして平均値を取るという操作を、何度も何度も繰り返すと、その平均値の分布は、N(μ,(σ/√n)^2)という分布になります。

つまり、母集団の標準偏差をσとすると、平均値の分布の標準偏差は、σ/√n になるのです。

~~~~~~~~~~~~~~~~~~~~~~~~~~

ちなみに、不偏標準偏差ではありません。不偏分散の平方根と言いましょう。(標本標準偏差に対して)単に標準偏差でも良いです。

不偏標準偏差は実際にはあるのですが、ガンマ関数を用いた複雑な式です。
不偏分散の平方根は、残念ながら小さい側に偏っています。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!