至急統計学の問題の解説をお願いします

Question

解答、解説がわからなくて困っています。
問題1.ある鉱石に含まれる鉄分含有率（%）を調べたところ次のデータを得た。
10.5 8.5 7 10 11.5 8 12 12.5
鉄分含有率は正規分布に従うとする。

1-1標本平均の値を以下の中から選択せよ
（1.870829  2  3.5  4  10）
1-2（不偏）標本分散の値を以下の中から選択せよ
（1.870829  2  3.5  4  10）
1-3（不偏）標本標準偏差を以下の中から選択せよ
（1.870829  2  3.5  4  10）
1-4自由度7の両側0.01点t7（0.01）の値を以下の中から選択せよ
（3.2498  3.3554  3.4995  3.8325  4.0293）
1-5母平均μの99%信頼区間を以下の中から選択せよ
（7.702044,12.29796  7.627374,12.37263  7.52548,12.47452  7.290013,12.70999  7.150855,12.84915）

問題2ある国の大統領選にA,Bの2人が立候補した。選挙予想をするために、有権者から無作為に検査対象を選び出しどちらを支持するかのアンケート調査したところ無作為に選んだ300人中180人がAを支持すると回答した。その時次の問いに答えよ。

2-1標本比率の値を以下の中から選択せよ
（0.2  0.3  0.4  0.5  0.6）
2-2Aの支持率の97%近似信頼区間を以下の中から選択せよ
（0.5445628,0.6554372  0.5386231,0.6613769  0.5271397,0.6728603  0.5010192,0.6989808  0.4916005,0.7083995）

解答教えてください。よろしくお願いします。

yhr2 · Accepted Answer

テキストはちゃんと読んだのかな？
いくらなんでも「標本平均」ぐらいは分かるでしょう？

「不偏分散」だって、テキストを見ればすぐ求まるでしょう？
計算は大量なので、表計算ソフト（エクセルなど）を使わないと大変ですが。

＞1-4自由度7の両側0.01点t7（0.01）

ちょっと問題を端折っていないかい？　「自由度７」って何のことか分かっているのかな？

問題２は「支持するか、支持しないか」の２択であって、コイントスや「くじに当たるか外れるか」と同じだよ。

yhr2 · Answer

No.1 です。

＞読んだのですが、だんだんこんがらがってきてしまいわからなくなってしまいました。

そもそも、「母集団」と「標本」の区別はつきますよね？
国民全体の「身長、体重」や「内閣支持率」は全員調査をしなければ分からないから、1000人とか2000人の「サンプル」をとって「国民全体」を推定するのです。

全製品の「寸法」や「重量」をチェックするのは大変なので、抜き打ちでサンプルを採って確認するのです。サンプルが１個では信頼性に欠けるので、10個とか100個とか、１万個に1個の割合で採って調べるのです。

（1ｰ1）その「取り出したサンプル」、問1では「8個のサンプル」の平均が「標本平均」ですよ。
計算すれば「10.0」ですね。

「ふつうの平均」って、それ以外にありますか？　「母平均」も「ふつうの平均」ですが、全数調べないと計算できないだけです。
全数調べる代わりに、「8個のサンプル」から推定するのです。

（1-2）「標本8個の分散」だと「3.5」ですが、「不偏分散」だと「4.0」ですね。
「標本8個の分散」は「標本平均」を使って計算しますが、この「標本平均」が「母平均」とどれだけ違うのか分からないので、この「標本平均の不確実さ」分だけ「少し大きくとった分散（ばらつき）」が「不偏分散」で、これが「母分散の推定量」になります。

（1-3）「不偏標準偏差」は「不偏分散」の平方根なので「2.0」。

（1-4）ここでいう「自由度7」とは、「自由度7 のｔ分布」を指すと思いますが、それが分かっていなければ、ここから先はやっても無駄です。
「ｔ分布」とは何か、なにの分布で、どんなときの使うのかを勉強してからでないと、この課題は解けません。

「ｔ分布」で、「自由度7」で「両側 0.01 = 片側 0.005」の値を読めということなので、意味も分からず「3.4995」と読み取っても、その先どうしようもないですね。

↓　t分布表(両側)
https://www.koka.ac.jp/morigiwa/sjs/td.htm

↓　t分布表(片側)
https://bellcurve.jp/statistics/course/8970.html

（1-5）標本平均をサイズ（サンプルの個数）を n、標本平均を Xbar、標本の不偏分散を s^2、母集団の平均を μ とすれば、
　T = (Xbar - μ)/√(s^2 /n)
の分布を「ｔ分布」と呼びます。
この分布で、99％がその中に入る範囲が
　-3.4995～3.4995
というわけです。（プラス側、マイナス側の「両側」がこの範囲から外れる T の値が上の「3.4995」ということ）

従って、これを逆に使って、母集団の平均値の99%信頼区間が
　-3.4995 ≦ (10 - μ)/√(4.0/8) ≦ 3.4995
で推定できるというわけです。
これを変形すれば
　7.5254798･･･ ≦ μ ≦ 12.474520･･･
→　7.52548 ≦ μ ≦ 12.47452
となります。

と説明したところで、おそらくテキストと同じなんだよな。

問2：これは「二項分布」を使って、同じように「母平均」を推定するものです。世論調査の「内閣支持率」などはこうやって求めます。

＞2-1は0.6ということでしょうか？

「標本比率」とは、標本の全数の中の「着目するものの数」の比率ですから、この問題では「全数 300人 の中の、Aを支持する 180人の比率」です。
従って
　180/300 = 0.6

＞2-2は近似信頼区間というのがわからなくて、解くのを諦めてしまいました。

何故、テキストなりネットなりで調べようとしないのですか？　
ただし、別に大した意味ではないと思います。「二項分布は、試行回数（サンプル数）がある程度大きければ正規分布で近似できる」ということから、「正規分布で近似して求めた信頼区間」程度の意味だと思いますよ。

二項分布とは、確率 p の事象が、 n 回試行したときに起こる回数の分布です。
コイントスで「表」の出る確率 1/2 とか、サイコロで「１」の目が出る確率 1/6 のときに、ｎ回やって「表」や「1の目」が何回出るか、という分布です。
問題の場合には、確率に相当するのがＡの支持率、試行回数が「サンプル人数」、起こる回数が「アンケートでＡ支持と回答した人数」に相当します。
ここで、母比率が p の場合に、n 人をサンプルしたときのＡ支持と答える人数 X に対する
平均（期待値）は np
分散は np(1 - p) 
です。
上に書いたように、「二項分布は、試行回数（サンプル数）がある程度大きければ正規分布で近似できる」ので、
　Ｚ = (X - np)/√[np(1 - p)]
は標準正規分布で近似できることになります。
右辺の分子分母を n で割って
　Z = (X/n - p)/√[p(1 - p)/n]

ここで、X/n = 180/300 = 0.6、サンプル数が大きいときには分散を求めるための母平均は標本平均で近似して、
　Z = (0.6 - p)/√[0.6(1 - 0.6)/300] ≒ (0.6 - p)/0.02828427

標準正規分布の「信頼度 97%」（有意水準が片側 1.5%）は、下記の標準正規分布表から「2.17」なので
　-2.17 ≦ (0.6 - p)/0.02828427 ≦ 2.17
となります。
これを変形して整理すれば（ここまでの有効桁数はないと思いますが）
　0.538623134 ≦ p ≦ 0.661376865

↓　標準正規分布表
https://staff.aist.go.jp/t.ihara/normsdist.html

至急統計学の問題の解説をお願いします

テキストはちゃんと読んだのかな？

No.1 です。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング