システムメンテナンスのお知らせ

信頼区間の推定  表に8尾の体調測定の結果を示しています。母集団は正規分布であるが分散の値は道である場合、平均値の95%の信頼区間を計算しなさい

番号  1   2   3   4   5   6   7   8
体長 28.0  29.6 31.8 28.1  34.3 33.1  31.4  28.9 

私は統計学だけでなく理系科目がが苦手なようです…(号泣)
どうかよろしくお願いします。

gooドクター

A 回答 (1件)

>私は統計学だけでなく理系科目がが苦手なようです…



統計って、みんな面倒がるけど、基本はそんなに難しくはありません。
ランダムに起こること(世の中のほとんどのものがそうです)が従う「正規分布」というものをきちんと理解すれば、だいたいのことがわかります。

得られたデータを処理する「記述統計」よりも、お示しのような得られた標本のデータから、未知の母集団の特性を推定する「推測統計」こそが統計の活躍の場です。

8つの「体長」測定結果から、母集団の「平均」も「8つの標本の平均」のあたりにありそうだと推定できますね。でも、どの程度ずれるかが推定できない。
もし「母集団の分散」が分かっていれば、「8つの標本の平均」の周りの「母集団の分散」程度の範囲内にあることがわかります。

ということで、「8つの標本の分散」(ばらつき方)から、「母集団の分散」を推定します。
「8つの標本の分散」は、「8つの標本の平均」からの各々の「ずれ」(偏差)を2乗したもの(2乗偏差)の平均です。つまり「2乗偏差の合計」を「標本の個数:8」で割って求めます。
では、「母集団の分散」は、この「8つの標本の分散」と同じとみなしてよいか、というと、そうはなりません。「母集団の分散」は「母集団の平均」の周りのばらつきですが、「8つの標本の分散」は「8つの標本の平均」の周りのばらつきなので、そもそも「8つの標本の平均」と「母集団の平均」が一致しているのかすらわからないので、「標本の2乗偏差の合計」には不確定要素がたくさん含まれていることになります。
ということで、「母集団の分散」を推定するときには、「2乗偏差の合計」を「標本の個数:8」で割るのではなく、標本数よりも1少ない「8 - 1 = 7」で割ります。これが「不偏分散」と呼ばれるものです。要するに「8つの標本の分散」が不確実な分、そこから少し大きめに「母集団の分散」を推定するわけです。

そして、その「推定した母分散」から「8個の標本」をとってきたときの標本平均は「自由度 7 (= 8 - 1)のt分布をする」ということを使って、「95%の信頼区間」ということなら、得られた標本の平均がt分布の「2.5%~97.5%(その間が 95%、範囲外となるのは「両側 5%」)」になるような範囲が「母集団の平均の95%の信頼区間」になります。

ちょっと端折って書いていますが、教科書にはきちんと詳しく書いてあると思います。

与えられた標本のデータを電卓で処理するのはちょっと辛いので、エクセルなどの表計算ソフトを使ってください。
そうすれば
・平均:30.65
・分散:4.8625
・不偏分散:5.5571
となります。

さらに、自由度 7 のt分布の「両側 5%」となる値は、下記の「t分布表」から
 2.3646
となります。
↓ 
t分布表
https://www.koka.ac.jp/morigiwa/sjs/td.htm

以上から、母集団の平均を μ とすると
 -2.3646 ≦ (30.65 - μ)/√(5.5571/8) ≦ 2.3646
が成立することになります。
ここから μ の範囲を求めれば
 -1.97 ≦ 30.65 - μ ≦ 1.97
→ 28.68 ≦ μ ≦ 32.62

これが「母平均の95%の信頼区間」です、
「母平均は、95% の確からしさでこの範囲内にある」ということです。
    • good
    • 0
この回答へのお礼

ご丁寧にありがとうございます。
とてもありがたいです!!!

お礼日時:2020/09/18 16:24

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

gooドクター

人気Q&Aランキング