アプリ版:「スタンプのみでお礼する」機能のリリースについて

すいません、学校の確率統計の授業がちんぷんかんぷんで
どうか下記の問題の解き方を教えてください。
どうかおたすけください!

ある県の平均体重を推定したく、実際に10名の体重を測ったら次のような結果がでた。体重の分布は正規分布で分散については50と分かっている。母平均の95%の信頼度で推定した区間を求めよ。
59.0、58.5、52.2、52.6、48.1、67.0、64.7、52.3、59.0、54.6

以上、よろしくお願いします。

質問者からの補足コメント

  • すいません、計算があいません。

    (Xバー)=(59.0+58.5+52.2+52.6+48.1+67.0+64.7+52.3+59.0+54.6)/10=55.8

    分散は 50/10=5
    σ=√5 です。

    xバー±1.96√5

    51.4≦X≦6.02 となるのですが、(Intercept) 52.54378 61.05622と答えがあいません。

    No.2の回答に寄せられた補足コメントです。 補足日時:2022/07/27 11:21
  • うーん・・・

    すいません、計算があいません。

    (Xバー)=(59.0+58.5+52.2+52.6+48.1+67.0+64.7+52.3+59.0+54.6)/10=55.8

    分散は 50/10=5
    σ=√5 です。

    xバー±1.96√5

    51.4≦X≦6.02 となるのですが、(Intercept) 52.54378 61.05622と答えがあいません。

    No.1の回答に寄せられた補足コメントです。 補足日時:2022/07/27 11:24

A 回答 (6件)

No.1 です。


#2 さんと違って、私は「R」などの統計ツールを使いこなせないので、アナログに手計算しかできません。

>(Xバー)※この記号でいいですか?=(59.0+58.5+52.2+52.6+48.1+67.0+64.7+52.3+59.0+54.6)/10=55.8

10個のサンプルの平均は「Xバー」のように書くことが多いですね。
私が計算したら「56.8」になりましたよ?

これから推定すると、母平均は「56.8」の近辺にありそう、ということになります。
問題は、どの程度の「バラツキ」で「56.8」の近辺にあるかということです。ここでは「95%の信頼度」で「ありそうな範囲を示せ」ということですね。つまり「確率 0.95 で存在する範囲」ということ。

そのためには、「10個のサンプル」をたくさん採ってきたときの「10個のサンプルの平均値のバラツキ」(これは「正規分布」するとみなせる)が、「母集団の分散 50」からどのように推定できるかを調べる必要があります。

>分散は V(Xバー)の記号で正しいですか?そうするとσ²=50でよいでしょうか?

10個のサンプルの分散なら V(X) ですが(Xバーではなく)、この場合には「母分散 = 50」と分かっているので、「10個のサンプル」をたくさん採ってきたときの「10個のサンプルの平均値」の分散が必要です。
それを V(Xバー)と呼んでいるのですね?

(注)もし母分散が未知であれば、サンプルから計算した「不偏分散」を母分散の推定値として使います。サンプル数 10 で割るのではなく、サンプル数 - 1 = 9 で割ったものですね。「分散」の計算に使う「平均値」が、「母平均」が未知なので「サンプル平均」を使わなければいけないため、そんな計算になります。
ただし、この問題の場合には、#2 さんがおっしゃるように「奇跡的に」母分散が「50」と既知なので、単純にそれを使います。


「母分散 = 50」の母集団から「10個のサンプル」をたくさん採ってきたときに、その「10個のサンプルの平均値」は、10個各々の「平均からの2乗偏差(その平均が「母分散」に等しい)」の平均なので、その分散は
 50/10 = 5
になります。

(注)何かの測定をするときに、「測定誤差」を小さくするために「10回測定して、その平均をとる」ようなことをしますね。測定回数を多くしてその平均をとると、誤差やバラツキを小さくできるのです。n 回測定して平均をとると、分散を 1/n に、標準偏差を 1/√n にできます。


>なぜかσ=√V(Xバー)=√5 ということですか?

「標準偏差」は単純に「分散の平方根」なので(そういう定義)
 √5
になります。

従って、母平均は「サンプル平均:56.8」の近辺にあり、「標準偏差:√5」でばらつくと推定できます。
正規分布で平均を中心に 95% の確率となる範囲は
  平均 ± 1.96σ
ですから、
 56.8 ± (√5) × 1.96
≒ 56.8 ± 4.38
となります。

つまり
 52.4 ~ 61.2


#2 さんの計算結果では
「> # 既知の標準偏差から正規分布仮定で求める」
のところを見ないといけませんね。

あなたがあてずっぽうで「見た」ところは
「> # 平均値の信頼区間を求める(t分布)」
のところですね?
これは「母分散が未知」のときに、「サンプルの不偏分散」を母分散の推定値として使ったときの「信頼区間」だと思います。
そのときには「正規分布」ではなく「t分布」を使います。
    • good
    • 0
この回答へのお礼

誠にありがとうございます。
ご丁寧に説明して頂いて大変助かりました。
しかも詳細な説明です。ここまで理解されてることに
尊敬いたします。お答え頂いたのも大変光栄に思います。
確率統計をどうしても極めたいです。努力します。
お助けがなかったら挫けていました。

最後にこの表現は間違っていなでしょうか?
テキストを読破するにはどうしても記号もよく覚えないと前に進めないです。
52.4≦X≦61.1
それとも52.4≦x≦61.1 でしょうか?

以上、よろしくお願いします。

お礼日時:2022/07/27 12:52

No.4 です。

「お礼」に書かれたことについて。

>最後にこの表現は間違っていなでしょうか?
>テキストを読破するにはどうしても記号もよく覚えないと前に進めないです。
>52.4≦X≦61.1
>それとも52.4≦x≦61.1 でしょうか?

一般に、統計変数を大文字で、個別の具体的データを小文字で表現することが多いようです。

X = {x1, x2, ・・・, xn}

のように。

この場合には「母平均の範囲」を示すので、そのどちらでもなく
 52.4 ≦ μ ≦ 61.1
あるいは「X の母平均」という意味で
 52.4 ≦ μx ≦ 61.1
と書くと思います。

「母集団の平均」を μ、そこから抽出したサンプル X = {x1, x2, ・・・, xn} の平均を Xバー と書くことが多いです。
ここで答えるのは「母平均の範囲」ですから、式で書くなら「μ」を使うのがふつうだとと思います。

いずれにせよ、「記号の使い方」は単なる約束事であって、お使いのテキストや指導教官がどんな「約束事」のもとで使っているかだけの話なので、あまり気にすることはないと思います。
    • good
    • 0
この回答へのお礼

ありがとうございました。
記号の使い方も理解できました。
またグレードアップすることができます。
初学者にとって、このように実際の問題を解き方を
教えてもらうと、何が常識で駄目なのか明確になって
確率統計にますます興味が湧いてきました。

お礼日時:2022/07/27 13:14

yhr様、私の計算結果についての補足、ありがとうございます。



私からNo.4にベストアンサーを付けさせて頂きます!
    • good
    • 1
この回答へのお礼

kamiyasiro さま

本当にありがとうございました。
恩を忘れず日本のために勉学に励みたいと思います。

お礼日時:2022/07/27 12:55

>答えは、52.54378≦X≦61.05622 だと思いました。


>どうでしょうか?

下のはt分布って書いてあるでしょ。

あと、補足に書かれた内容ですが、平均を計算し直してくださいね。

厳密値を使わず、1.96使っても、

52.41731~61.18269

↑ √5を丸めてないけど。電卓では丸めないでしょ。
    • good
    • 0
この回答へのお礼

誠にありがとうございます。

平均は56.8でした。書き写すときにミスしたと思われます。
致命的なミスです(泣)たぶん、ワーキングメモリが私は弱いです。バカな人間です(泣)

計算も合いました。

t分布というのが理解できていませんでした。t分布はまだよくわかりません。勉強するしかないです。

52.41731≦X≦61.18269
それとも 52.41731≦x≦61.18269

この表現が一般的な書き方になりますか?

以上、よろしくお願いします。

お礼日時:2022/07/27 12:10

#1さんに1票。



でも、この手の問題は多いですよね。母平均が未知なのに、なんで母分散が分かるのか。母分散を計算するには母平均が必要でしょうに。

でも、母分散未知だと、t分布を使う必要があり難しいから、こんなちんぷんかんぷんな問題になるんです。

でも、この先生はすごいですよ。

ちゃんと、この無理な設定と、サンプルからt分布で求めたものとが、それなりの数値で一致するように、データで合わせ込みをしています。

ツッコミを入れようとしたら、見事に裏切られました。脱帽!


以下はRでの計算結果。答が出ていますが、それがどこかは言いません。答え合わせに使って下さいね。

> x <- c(59.0, 58.5, 52.2, 52.6, 48.1, 67.0, 64.7, 52.3, 59.0, 54.6)
>
> n <- length(x)
> sd <- sqrt(50) # 母分散は既知
>
> # 既知の標準偏差から正規分布仮定で求める
> mean(x) + (qnorm(0.025) * sd / sqrt(n))
[1] 52.41739
> mean(x) + (qnorm(0.975) * sd / sqrt(n))
[1] 61.18261
>
> # 平均値の信頼区間を求める(t分布)
> fit <- lm(x ~ 1)
> confint(fit, level = 0.95)
2.5 % 97.5 %
(Intercept) 52.54378 61.05622
この回答への補足あり
    • good
    • 1
この回答へのお礼

本当にありがとうございます。

仰るとおり、母分散を計算するには母平均が必要ですね。
問題には、「体重の分布は正規分布で、分散については過去のデータから50と分かっている。」とかいてます。

これって母分散の話ですか?それとも標本分散の話ですか?わけからないです。

Rでの計算結果ってなんですか?R言語?
言語がわからないので、さっぱりです。

答えは、52.54378≦X≦61.05622 だと思いました。

どうでしょうか?

お礼日時:2022/07/27 10:40

10人のサンプルの「平均」は計算できますか?



母集団の平均は、そのサンプルの平均の近くにあると推定できますよね。

では、今回は1つの「10人分のサンプル」でしたが、無作為にたくさんの「10人のサンプル」を採ってきたとき、その平均はどんな分布をしそうでしょうか。
最初のサンプルの平均の周りに、母分散 50 に相当するバラツキで分布しそうですよね。
「10人のサンプルの平均」の分散なので、「平均より大きいもの、小さいもの」がならされて、50/10 = 5 になります。

つまり、「10人のサンプルの平均」は、
・最初の10人分のサンプル(問題に挙げられているもの)の平均
の周りに
・分散が 50/10 = 5 つまり標準偏差 √5
で正規分布すると推定されるのです。

どうしてそう推定できるのか、本当にそうなのかは、テキストを読んで復習してください。

正規分布で「95%」がその範囲内に入るのは、正規分布の特性から
 平均 ± 1.96σ
になります。つまり
 平均 ± (√5) × 1.96

これが「母平均の95%の信頼度で推定した区間」ということになります。

10人分のサンプルの平均は、ちゃんと自分で計算してください。
この回答への補足あり
    • good
    • 1
この回答へのお礼

本当にありがとうございます。

(Xバー)※この記号でいいですか?=(59.0+58.5+52.2+52.6+48.1+67.0+64.7+52.3+59.0+54.6)/10=55.8

分散は V(Xバー)の記号で正しいですか?そうするとσ²=50でよいでしょうか?ここからわからなくなってくるのです。教科書をみると記号が多すぎて(泣)
V(Xバー)=σ²/n=50/10 = 5

なぜかσ=√V(Xバー)=√5 ということですか?
だんだんわからなくなってきました。

どこか間違っていますか?

お礼日時:2022/07/27 10:30

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!