プロが教えるわが家の防犯対策術!

統計の問題です、力を貸してください。。
118人の男子の座高の平均が88.8cm、標準偏差が3.5cmである。この時、母集団の平均値の95%信頼区間を求める、という問題です。

A 回答 (7件)

企業でSQCを推進する立場の者です。



これって、本当にこの文章で出題されましたか?
私が指摘したいことは、118人はサンプルか、全数かどうかということです。私はこの文章からは、どちらか読み取ることができません。
もっと言うなら、母分散既知か母分散未知かで回答は異なります。
    • good
    • 0

どんな母集団ですか?


全世界から118人の男子を選んだって、民族・国も違うし、0歳児から老人までいて、とても全体を推定できませんね。

また、その118人はどのように選ばれたのですか? 「身長の高い方から118人選んだ」のだったら、これまた元の集団の座高の推定などできませんね。
    • good
    • 0

#2さんへ、



いやいや、118人は「ある母集団」から「ランダムに」得られたサンプルだというのが、暗黙の了解でしょう。
一方、私は118人が全数かもしれない、と言っています。
つまり、t分布か正規分布かの問題を指摘しているのです。
抜き取りであれば、母分散未知で区間推定しなければなりません。
まあ、118人もあれば大して違わないのですが、手順としてはキチンと覚えておいた方が良いですよね。

なお、下の計算において、母集団既知というか全数の時は、標本標準偏差が、
母集団未知のときは不偏分散の平方根が、標準偏差として求められているとします。

> # 数表を引くのが面倒なのでRで
>
> m <- 88.8
> s <- 3.5
>
> # 母分散既知の場合(118人が全数である場合)
>
> m - qnorm(0.975) * s # 信頼下限
[1] 81.94013
> m + qnorm(0.975) * s # 信頼上限
[1] 95.65987
>
> # 母分散未知の場合(118人が抜き取りである場合)
>
> m - qt(0.975, 117) * s # 信頼下限
[1] 81.86843
> m + qt(0.975, 117) * s # 信頼上限
[1] 95.73157
>
>
    • good
    • 0

寝ぼけていて間違えました。

「」内に訂正します。

なお、下の計算において、母「分散」既知というか全数の時は、標本標準偏差が、
母「分散」未知のときは不偏分散の平方根が、標準偏差として求められているとします。
    • good
    • 0

独り言です。



全数であれば、平均値は確定的だから、区間推定は無意味でしょうか。

また、標本であれば、求められた信頼限界の中に平均値がある確率は95%なんでしょうか。

上記はいずれも間違いです。
このあたりは、記述統計学の限界でしょうかね。

この問題を出された先生が「大標本理論」ということを教えていれば、n>30くらいであれば、母分散未知でも正規分布を使いなさいと教えていると思うので、t分布でやらなくても良いです。そのための100を超えるサンプル数なのかもしれませんね。現実的な先生です。

だいたい、母分散既知で平均が未知なんて前提を置いたりしますが、どうやればそんな観測ができるのか、統計の問題っておかしなことばかりです。もう、これについてつべこべ言うのをやめようとする人達もいます。

アフリカのある部族の成人男性は118人しかおらず、座高は88.8cmだった。全数調査である。
隣村は違う部族でやはり成人男性は118人しかおらず、座高は88.7cmだった。全数調査である。
全数調査だから、平均はばらつきを持たないので、この部族間には明らかな座高の違いがあると言える。
と言いますか?
これについて何とも言えないのが記述統計の限界なんですよね。

こんなことをつべこべ言わずに、サンプルだろうが全数だろうが、n数がある程度大きければ正規分布でやろう、と先生は語って見えましたか。

てか、WEB授業を真面目に聞いていれば、こんな問題、自分で解けますよね(独り言です)。
    • good
    • 0
この回答へのお礼

独り言が偶然聞こえました。
教えを乞う立場として非常に失礼とは重々承知の上で言わせていただきます。私は大学四年生でそもそも統計学を全く履修していません。後輩から、課題を解いて欲しいと言われ自分なりに考えてみたのですが未履修の身分には限界があり、質問させて頂きました。ちなみにこの問題文は紛れもなく後輩から送られてきた全文であり、情報が足りないなら、作成者側のセンスがないという事なんでしょうか。
壮大な独り言でした。

お礼日時:2020/07/10 09:41

#5です。



それはそれは失礼しました。後輩に頼られるのは、良い先輩だからです。

ネットで「検定・推定」というワードで調べれば、推定という項目で「区間推定」について述べられていると思います。「区間推定」というワードで調べてもヒットすると思います。

方法が2つあって、
①母分散既知の場合→正規分布を当てはめて95%区間を推定する
②母分散未知の場合→t分布を当てはめて95%区間を推定する

という方法に行き当たると思います。

今回は、そのどちらを用いるのか、ということが設問からは明確に決められないのです。
ですが、「大標本論」者はどちらであっても①で良いじゃん、という一派です。

すると、81.94013 ~ 95.65987 が解答になります。
    • good
    • 0

#3です。



まだ、閉じてなくて良かったです。
お詫びしなければなりません。
#3の投稿は、本当に寝ぼけていました。大間違いをしていました。

平均の標準偏差はs/sqrt(n) なんですが、私はsのまま計算していました。

大恥をかく前に修正できて良かったです。閉じずにいて下さってありがとうございました。
後輩の方にも至急訂正をお願いします。

以下は訂正した計算結果です。

> # 数表を引くのが面倒なのでRで
>
> m <- 88.8
> s <- 3.5
>
> # 母分散既知の場合(118人が全数である場合)
>
> m - qnorm(0.975) * s/sqrt(118) # 信頼下限
[1] 88.1685
> m + qnorm(0.975) * s/sqrt(118) # 信頼上限
[1] 89.4315
>
> # 母分散未知の場合(118人が抜き取りである場合)
>
> m - qt(0.975, 117) * s/sqrt(118) # 信頼下限
[1] 88.1619
> m + qt(0.975, 117) * s/sqrt(118) # 信頼上限
[1] 89.4381
>
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!