プロが教える店舗&オフィスのセキュリティ対策術

大学数学、確率論の問題です。

次のデータは小学1年生12人の身長を測ったものである。このデータに基づいて、母平均の信頼度99%の信頼区間の信頼区間を求めよ。
113.6,130.4,115.6,125.9,110.1,122.0,120.5,109.9,117.4,110.4,113.3,112.9

わかる方いませんか?

A 回答 (7件)

間違い訂正させて下さい。



誤:(信頼限界)=(平均) ±t(0.99,φ)×(標準偏差)



正:(信頼限界)=(平均) ±t(0.995,φ)×(標準偏差)

片側0.5%ずつ、両側で1%外れるようにしないといけませんね。
    • good
    • 0

下記計算結果のごとく、



下部信頼限界
 110.9019
上部信頼限界
 122.7648

です。検算にお使い下さい。

平均や分散・標準偏差の求め方が分かっていれば、

(信頼限界)=(平均) ±t(0.99,φ)×(標準偏差)

で、t値はt表から読み取って下さい。


> # 母平均の99%信頼区間
>
> x <- c(113.6, 130.4, 115.6, 125.9, 110.1, 122.0, 120.5, 109.9, 117.4, 110.4, 113.3, 112.9)
> n <- length(x)
> n
[1] 12
>
> m <- mean(x)
> m
[1] 116.8333
>
> sd <- sd(x)
> sd
[1] 6.61573
>
> msd <- sd / sqrt(n)
> msd
[1] 1.909797
>
> # 一般的には、
> conflowr <- m + qt(0.005, n - 1) * msd
> confuper <- m + qt(0.995, n - 1) * msd
> conflowr
[1] 110.9019
> confuper
[1] 122.7648
>
> # マニアックな求め方
> fit <- lm(x ~ 1)
> confint(fit, level = 0.99)
0.5 % 99.5 %
(Intercept) 110.9019 122.7648
>
> # t検定のものとも一致する
> t.test(x, y = NULL,
+ alternative = c("two.sided"),
+ mu = 120, paired = FALSE, var.equal = FALSE,
+ conf.level = 0.99)

One Sample t-test

data: x
t = -1.6581, df = 11, p-value = 0.1255
alternative hypothesis: true mean is not equal to 120
99 percent confidence interval:
110.9019 122.7648
sample estimates:
mean of x
116.8333
    • good
    • 0

Rを使っても良ければ、スクリプト書きますよ。

    • good
    • 0

「確率論」というよりも「統計」だね。



サンプルの「平均」「分散」「不偏分散」は求められるかな?
そこまでは「目の前にあるデータを処理する」だけの「記述統計」。

大学の「統計」の最大の活躍の場は、それを使って未知の情報を「推定」すること。それを「推測統計」と呼ぶ。
お示しの問題は、その第一歩。

「サンプル」から処理して得られる「不偏分散」は、未知の母集団の「母分散」の推定値になる。
それを使うと、サンプルの平均は「t分布」すると推定できる。
それらから「母平均はこの範囲にありそう」と推定するのが「母平均の信頼区間」。
どの程度の「確かさ」で推定するのかが「信頼度」。

そういった「基本的な建て付け」を理解した上で、テキストを復習してみて下さい。
    • good
    • 0

個人的に「ハンバーガー統計学」がお勧めだ。

    • good
    • 0

この手の投稿が後を絶たない。



「母分散未知の場合の母平均の信頼区間の求め方」で検索すればズラッと解説が出てくる。
t分布を使う。
    • good
    • 0

信頼度99%の信頼区間は、母集団の従う分布が正規分布で、かつ、データが無作為抽出されたものであれば、t分布を使う。

母集団の従う分布の確率密度関数(パラメータを含む)がわかっているがパラメータの値は未知であって、かつ、データが無作為抽出されたものであれば、ベイズ推定(モンテカルロ法を使った積分)を行う。どちらでもなければ厳密な答は出せないので、「何らかの仮定のもとでの推定」を行うことになる。
 さて、その「仮定」がまたパラメータを使って表されるモデルであるがパラメータの値が未知である、という場合には、「信頼区間の信頼区間」が意味を持つ。ここで、どんな「仮定」が適切かは問題領域ごとに考える必要があるが、この話の設定では雑駁すぎて絞れない。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!