遅刻の「言い訳」選手権

次の統計学の問題をご教授戴きたいです。
ある高校の全校生徒から25人を無作為に抽出したところ、その25人の身長の平均は170cm、標準偏差は6cmでした。
この時、次の問いに答えなさい。(小数の場合は、小数点第3位を四捨五入し、小数第2位までを求めなさい。)
①全校生徒の身長の平均値の点推定値は、いくらか?
②全校生徒の身長の分散の点推定値は、いくつか?
③全校生徒の身長の標準偏差が10cmと分かっている場合の全校生徒の身長の平均値の区間推定値の上限値(信頼係数95%)を求めよ。
④全校生徒の身長の標準偏差が分からない場合の全校生徒の身長の平均値の区間推定値(信頼係数95%)の上限値を求めよ。
⑤全校生徒の身長の標準偏差の区間推定値(信頼係数95%)の下限値を求めよ。
⑥「全校生徒の平均身長が171cmである」という帰無仮説を立てた場合の両側検定について、対立仮説を述べよ。
⑦⑥の帰無仮説を立てた場合の両側検定について有意水準を5%とした場合、検定統計量はいくつよりも大きければ棄却されるでしょうか?その数値を述べよ。(全校生徒の身長の標準偏差が10cmと分かっているものとする)
⑧⑥の帰無仮説を立てた場合の両側検定について有意水準を5%とした場合、検定統計量はいくつよりも小さければ棄却されるでしょうか?その数値を述べよ。(全校生徒の身長の標準偏差が10cmと分かっているものとする)
⑨⑥の帰無仮説を立てた場合の両側検定について検定統計量を求めよ。(全校生徒の身長の標準偏差が10cmと分かっているものとする)
⑩⑥から⑧を踏まえ「検定統計量が棄却域に入って[a]ため、前提としていた帰無仮説は、棄却[b]、対立仮説が正しいと[c]。
aは、「いる」と「いない」のどちらか?
bは、「され」と「されず」のどちらか?
cは、「言える」と「言えない」のどちらか?

A 回答 (17件中1~10件)

No.3です。



解答です。答え合わせに使って下さい。
正規分布表、t表、F表は与えられているという前提です。

①全校生徒の身長の平均値の点推定値は、いくらか?
170cm

②全校生徒の身長の分散の点推定値は、いくらか?
36cm^2

③全校生徒の身長の標準偏差が10cmと分かっている場合の全校生徒の身長の平均値の区間推定値の上限値(信頼係数95%)を求めよ。
170+10/√25×u(0.975)=170+2×1.96=173.92(cm)

④全校生徒の身長の標準偏差が分からない場合の全校生徒の身長の平均値の区間推定値(信頼係数95%)の上限値を求めよ。
170+6/√25×t(0,975,24)=170+1.2×2.064=172.4768≒172.48(cm)

⑥「全校生徒の平均身長が171cmである」という帰無仮説を立てた場合の両側検定について、対立仮説を述べよ。
H1:μ≠171

⑤全校生徒の身長の標準偏差の区間推定値(信頼係数95%)の下限値を求めよ。
全校生徒数は無限大と仮定する。
F(24,∞,0.025)=s^2/σ^2 より
σ^2=36/F(24,∞,0.025)=36/12.40115=21.94895
σ=4.684971≒4.68(cm^2)
χ^2を用いてやっても同じになるが、これは最初から母集団は無限大だと仮定しているので、本問のような本来有限母集団の時はF分布で推定します。

⑦⑥の帰無仮説を立てた場合の両側検定について有意水準を5%とした場合、検定統計量はいくつよりも大きければ棄却されるでしょうか?その数値を述べよ。(全校生徒の身長の標準偏差が10cmと分かっているものとする)
u(0.975)=1.96

⑧⑥の帰無仮説を立てた場合の両側検定について有意水準を5%とした場合、検定統計量はいくつよりも小さければ棄却されるでしょうか?その数値を述べよ。(全校生徒の身長の標準偏差が10cmと分かっているものとする)
u(0.025)=ー1.96

⑨⑥の帰無仮説を立てた場合の両側検定について検定統計量を求めよ。(全校生徒の身長の標準偏差が10cmと分かっているものとする)
z=(170ー171)/(10/√25)=ー0.5

⑩⑥から⑧を踏まえ「検定統計量が棄却域に入って[いない]ため、前提としていた帰無仮説は、棄却[されず]、対立仮説が正しいと[言えない]。
    • good
    • 0

補足です。



現在のあきれた状況を整理しておきます。

今のJISでは、「全数の標準偏差」に該当する語句が無い。
偏差平方和を(n-1)で割ったものだけが、唯一の標準偏差。それを標本標準偏差と言わせている。母集団ばらつきの「指標」だと言っている。(=推定値じゃない)

高校までの教育では、「全数の標準偏差」を「標本」が付かない標準偏差として教えている。
偏差平方和を nで割ったものだけが、唯一の標準偏差。

ということです。

私は、JISも指導要領も、両方とも改訂して欲しいです。
    • good
    • 0
この回答へのお礼

ありがとう

お礼日時:2024/08/31 00:42

標準偏差と標本標準偏差の違いについて



不偏標準偏差※という言葉はないので、上記を明確に使い分けていくしかありません。※厳密にはガンマ関数を用いて導出することは可能

・標準偏差は不偏分散の平方根であり母標準偏差の点推定値(ただし不偏推定量ではない)、Excelではstdev()、信頼区間あり。
・標本標準偏差は標本分散の平方根でありその標本そのものの標準偏差、Excelではstdev.p()、pはポピュレーション:全数の意味、信頼区間なし。
です。

エクセルでは、全数かどうかで線引きしており、分かりやすいです。

標本標準偏差の「標本」とは、「その標本の」と解釈すべきで、それが全数だということです。日本では少なくとも2006年までは、普通のテキストにそう書いてありました。

しかし、これを常識とするのは、最近では通じなくなってきているようです。

2006年のJISの改訂で、偏差平方和を (n-1) で割ったものを、ISOに準拠する形で、不偏分散ではなく標本分散と呼ぶことになりました。
それに従って、その平方根は標本標準偏差だと言える状態になっています。

つまり、標準偏差=標本標準偏差になってしまいました。
注意が必要です。

しかも、不偏分散の平方根は厳密には母標準偏差の不偏推定量ではない(1999年のJISではそう明記されていた)にもかかわらず、2015年のJISの改定では、「標本標準偏差※はばらつきの指標である」という曖昧な表現になりました。
※この標本標準偏差は従来の標準偏差の意味です。本来、標本標準偏差は指標とかいう曖昧なものではなく正確な値です。信頼区間は0です。

さらに、JISをつかさどる経産省工技院と文科省の指導要領には整合性がありません。
高校までは、標準偏差=標本標準偏差ともとれる扱いをしています。

なお、産業界では、従来の用語の使い分けを踏襲しています。
おおかたの大学では、産業界に準じて教えられていると思います。
    • good
    • 0
この回答へのお礼

ありがとう

お礼日時:2024/08/31 00:43

Welchのt検定を使うべきとの回答がありますが、1標本なのでWelchのt検定は使いません。


t検定を使えという指摘であれば、その通りでしょう。

まぁ、No.5さんが「実際そんな値にはならないのではないか?」という指摘は重要で、そういうことに直ぐに気づけるるようになりたいですが、初学者にそこまで求めるのは酷な気がします。
練習なのだから段階を踏んで学んでいくものと思うので。

問題文の標準偏差が不偏分散の√をとったものかどうかは、テキスト次第なので、分らなければ"回答の方で"どちらを使った物か明示すべきでしょう。
(従って、標本標準偏差は不偏分散の√が正しいとするのは間違いであると思います。とはいえ、定義によって、標本分散、標本標準偏差の定義に違いがあることは触れるべきと思いますが)

個人の意見としてはそこまでおかしな問題とは思いません。
(そういう値に母標準偏差を指定しているので)
まぁ、実際のデータとはかけ離れていたり、標本標準偏差が10よりも有意に異なるという問題設定はいかがなものかとは思いますが。
    • good
    • 0

ちなみに、サンプルから求めた母分散の推定値の95%信頼限界は、



上限
> 36/qf(0.025, 24, Inf)
[1] 69.67096
下限
> 36/qf(0.975, 24, Inf)
[1] 21.94895

既知の分散100は、この範囲外です。

分散比のF検定の結果、p値は
> pf(36/100, 24, Inf)
[1] 0.001730254
となり、1%有意(高度に有意)です!

二つの平均値の差の検定には「等分散の仮定」がありますので、母分散が既知と言えども、この状況(分散が異なる状況)では検定は成立しません。

③④で「上限を求めよ」と書いていたのを、⑤で突然「下限を求めよ」に変わったのは、上限を知られたら困ると思ったからでしょう。

ということは、出題者は知っててやっている? 罪深いですね。
    • good
    • 0

てか、この問題・・・、



実は、サンプルから推定した分散と既知の分散が有意に違うのです。
だから平均値の差の検定は「ウェルチのt検定」を使うべきなのです。

そこに言及していないというか、気にしていないので、私は???でした。

「母分散既知でやれ」という指示に従いましたが、ツッコミを入れるところだと思いますよ。
    • good
    • 0

yhr2様



おっしゃるように、母集団の分散の点推定値は不偏分散であり、不偏分散の平方根から求めた標準偏差の2乗です。

今般の「標準偏差」は、QCとか現場とかを考えて、常識的に不偏分散の平方根が示されていると考えました。
なぜなら、断りもなく「標準偏差」と言っているからです。
標準偏差は、世間ではデフォルトで自由度で割ったものが使われます(Excelのstdev()とか統計ソフトRのsd()とか)。

もし、「標本標準偏差」と書いてあれば、yhr2様のおっしゃっているとおり、不偏分散に換算すべきです。
「その25人の身長の」と言っている点が微妙で、私も?と思ったんですが・・・。

しかし、そうすると、その後のsおよびs^2は、全て不偏分散に直す必要があります。
この問題は、そこまで求めていないような気がします。

出題者の意図が知りたいですね。
てか、意図があるのなら、明確に用語を使用して欲しいです。
    • good
    • 0

No.1 です。



②は、示されている「標準偏差が 6 cm」ということは、サンプル分散が 36 なので、母集団の分散の点推定値は「不偏分散」で
 36 × 25 / (25 - 1) = 37.5
ではありませんか?

④も
 170 + √(37.5/25) × 2.064 ≒ 172.53

そうすると⑤も変わりませんか?
    • good
    • 0

訂正投稿の訂正です。



誤)⑥の全体
F(24,∞,0.975)=s^2/σ^2 より
σ^2=36/F(24,∞,0.975)=36/1.64017=21.94895
σ=4.684971≒4.68(cm^2)



正)⑤の全体
F(24,∞,0.975)=s^2/σ^2 より
σ^2=36/F(24,∞,0.975)=36/1.64017=21.94895
σ=4.684971≒4.68(cm)

再々の訂正で、スミマセン。
    • good
    • 0
この回答へのお礼

ありがとう

お礼日時:2024/08/31 00:43

⑤の途中式の転記ミス



誤)σ^2=36/F(24,∞,0.025)=36/12.40115=21.94895
・・・12.40115はカイ2乗値でした。



正)⑥の全体
F(24,∞,0.975)=s^2/σ^2 より
σ^2=36/F(24,∞,0.975)=36/1.64017=21.94895
σ=4.684971≒4.68(cm^2)

いくつも、スミマセン。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


おすすめ情報

このQ&Aを見た人がよく見るQ&A