プロが教えるわが家の防犯対策術!

統計を専門ではない先生が授業をしているため、間違えや解説不十分が多く教科書を見てもわからなかったため教えていただきたいです。

Q母分散と不偏分散のみを入れ替えた問題が出たとき、全く同じ答えになってしまうのですがこれは正解なのでしょうか?


(例)
今、ある市の市民の平均年収が300万かどうかを標本数 n100 の標本を抽出することで 検定することを考えている。 母分散は25であることは知られている。 この検定に関する以 下の問題に答えなさいデータは正規分布に従うとする

(1) 帰無仮説と対立仮説を示しなさい。

帰無仮説ある市の平均年収が300万と差がない 対立仮設ある市の平均年収が300万とは異なる

(2) 平均年収を又、標本数をn、母分散を とした場合、 検定に用いられる統計量はどうなるか。 式で表しなさい。
(300-μ) (25/100)

(3) 帰無仮説が正しいとき、(2)で示した統計量はどういう分布に従うか
μがμ と等しい

(4) 有意水準5%のとき、棄却域はどうなるか
3.847<x

(5) 今標本抽出の結果、 標本における平均年収は295になった。 実際の統計値はいくつか
-2

(6) 計量の値はいくらになるか

(7) 帰無仮説は楽却されるか、採択されるか、結論づけなさい
棄却域より帰無仮説は破棄される



今、ある市の市民の平均年収が300万かどうかを標本数 n=100 の標本を抽出することで 検定することを考えている。 不個分数は25であることは知られている。

A 回答 (1件)

>ある市の市民の平均年収が300万かどうか



これは検定出来ませんよ。
「299万5000円でも「300万円ではない」ということになっちゃいますから。

「300万円以上かどうか」とか「300万円未満かどうか」などにするとか、
「集めた100人分のデータは『平均年収300万円の母集団から抽出した』といえるか」などにしないといけないでしょう。

使う手法は、『平均年収300万円、分散25(=標準偏差5万円)の母集団』から100個のサンプルを採ったら、
・その「平均値」の期待値は 300万円
・その「平均値」の「分散」の期待値は 25/100 = 0.25
 (その「平均値」の「標準偏差」の期待値は 5/√100 = 0.5 万円)
になるということです。

この「100個のサンプルの平均」の分布に対して、実際に採取した100個のサンプルの平均値から、その出現確率が『有意水準』以下であれば「統計的なバラツキでは起こり得ない」(そうなるには「理由・意味がある=有意である」)、そうでなければ「統計的なバラツキの範囲内である」と判定するということです。

>(1) 帰無仮説と対立仮説を示しなさい。

本当は、「否定したいこと」が「帰無仮説」、その結果結論付けたいことを「対立仮説」にするのですが、使える手法は上に書いたように「『平均年収300万円、分散25(=標準偏差5万円)の母集団』から100個のサンプルを採ったら」ということなので、これを「帰無仮説」に使うしかありません。
(「市民の平均年収は300万円ではない」を帰無仮説にしても、これでは「じゃあ、平均はいくつ?」ということになって統計的な処理のしようがない)

問題文に書かれた内容に即して書けば

帰無仮説 = 市民の平均年収は300万円である

対立仮説 = 市民の平均年収は300万円ではない

ということでしょうか。

>(2) 検定に用いられる統計量

これは、上に書いたとおり、帰無仮説が正しい(『平均年収300万円、分散25(=標準偏差5万円)の母集団』から採取したサンプルである)とすれば、「100個のサンプルの平均値は、平均 300万円、標準偏差 5万円の正規分布 N(500万, (5万)^2) になるので、100個のサンプル平均 X を「標準正規分布」に変換した
 Z = (X - 500万)/0.5万    ①
が検定対象の統計量になります。

>(3) 帰無仮説が正しいとき、(2)で示した統計量はどういう分布に従うか

(2) の統計量は、そもそも「帰無仮説が正しいとき」という前提での分布なので、ここで「帰無仮説が正しいとき」というのはおかしい。
 上に書いたように、Z は「標準正規分布」N(0, 1^2) なので、「平均が 0、標準偏差が 1 の正規分布」です。


>(4) 有意水準5%のとき、棄却域はどうなるか

この場合には、300万円よりも小さくても、300万円よりも大きくても「不適」なので、「有意水準」が 5% なら「下側 2.5%、上側 2.5%」が棄却される範囲になります。

標準正規分布表で、「上側 2.5%」となる Z(それ以上の確率(表に書かれた数値)が 0.025 となる Z)の値を探せば、
 Z = 1.96
あたりだと読み取れます。(正確には 1.95~1.96 の間ですが、1.96の方が近そう)
(標準正規分布は、平均 0 に対して「左右対称」ですから「下側 2.5%」となる Z の値は Z=-1.96 であることになる)

ということで、棄却域は
 Z < -1.96, 1.96 < Z    ②

標準正規分布表

https://staff.aist.go.jp/t.ihara/normsdist.html

>(5) X=295万 を①式に代入して

 (295 - 300)/0.5 = -10   ③

>(6) 計量の値はいくらになるか

意味不明。「計量の値」って何?
「統計量」なら (5) で求めている。


>(7) 帰無仮説は楽却されるか、採択されるか、結論づけなさい

②と③とを比較すれば
 -10 < -1.96
なので、「標本における平均年収は295万」は「有意」であり、統計的なバラツキでは起こり得ない。
ということで「統計的には『平均年収300万円、分散25(=標準偏差5万円)の母集団』から100個のサンプルとはいえない」という結論であり、帰無仮説は棄却される。


各々に付記されているものが、あなたの「解答」だとすると、かなりのものが間違えていますね。
そもそも「分散」と「標準偏差」の区別がついていない。「標準偏差」は「分散の平方根」で、「平均」と同じ単位です。「分散」は「2乗偏差(の平均)」なので単位を持ちません。
(2) の式では「標準偏差」の方を使います。


>Q母分散と不偏分散のみを入れ替えた問題が出たとき、全く同じ答えになってしまうのですがこれは正解なのでしょうか?

この質問の趣旨が分かりません。
どういう場合を想定しているのですか?
具体的に書いてもらえると回答もできると思いますが・・・。

与えられた問題では「母集団の分散」が分かっていますが、ふつうは未知です。その場合には「サンプルの分散」から「母集団の分散」を推定して使うことになります。そのときに使うのが「サンプルから計算した不偏分散」です。それが「母分散の推定値」になるからです。(その数学的根拠はテキストを復習してください)

そして、母分散が不明でサンプルサイズが小さいときには、サンプルから計算する「不偏分散」の不確定さが大きいので、統計量として「正規分布」ではなく「t分布」を使います。
通常であれば、サンプルサイズが 30以下であれば「t分布」を使います。
サンプルサイズがある程度大きければ、母分散が不明でも「正規分布」が使えます。

このように「母分散が未知か既知か」「サンプルサイズがいくつか」によって、使う手法が変わります。
手法が変われば、結論が変わることもあり得ます。
    • good
    • 0
この回答へのお礼

とても、丁寧な回答ありがとうございます
解けば解くほど迷宮入りしていたためとても助かりました。
まだ、途中までしか理解できていないのですがこのあともう一度取り組む予定です
私の回答も丁寧になおしていただけて、なんとお礼を言ったらいいかわかりません。
yhr2様の解説でわかると思うのですが、実は問題に続きがありそこは本当に理解できていないためお手上げのときまた、質問させていただけたらと思います。
お時間あったらまたご教授いただきたいです。
今回は、ありがとうございました

お礼日時:2022/09/14 19:04

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!