統計を学び始めたばかりの素人です。以下の問いについて解説をいただきたいです。
テキストの章末問題なのですが、解答のみで解き方が分からず質問させていただきました。
数学の知識もあまり無い状態で、式に使われている⊆みたいなものの意味もよくわかっていない状態です。
あるサイコロを720回なげたところ、3の目が138回でた。このとき、次の問いに答えよ。
(1)
三の目が出る回数をX、三の目が出る確率をpとし、帰無仮説H0:p=1/6が成り立つとする時、期待値E(X)と分散V(X)を求めよ。
↑について、期待値は720/6で120なのだなと何となくわかるのですが、分散についてどの様に計算して良いかがわかりません。
ちなみに答えは100となっています。
(2)対立仮説H1:p≠1/6に対して、有意水準5%で検定せよ
(3)対立仮説H1:p>1/6に対して、有意水準5%で検定せよ
↑については正直何も分からず、丸投げで申し訳ないのですが解説をお願いしたいです。
何が分からないのか言語化することすら難しいのですが、特に棄却域の決め方、またそれを利用して棄却されるか否かを検定するための計算方法を教えて頂きたいです。
計算記号の意味もよく理解できていないので、ご回答いただいたことに対して補足質問させていただくこともあると思いますが、どうかよろしくお願いいたします。
No.5ベストアンサー
- 回答日時:
No.2 です。
「補足」について。>の部分で、「10」は一体どこから現れたのか…と悩んでおります。
(1) の最後に書いた
「分散が「100」ということは、標準偏差はその平方根の「10」です」
の「標準偏差」です。
標準正規分布は「標準偏差が1」になるように規格化されているので、その標準正規分布表から読み取った値が「1.96」ということは、取り扱っている分布では標準偏差は「10」ですから「19.6」ということになります。
>その場合標準正規分布表のどこを見れば1.96が導けるのかがいまいちわかっていません。
下記の標準正規分布表では「1.96」の「1.9」を「左の見出し」から、その下の桁の「6」(つまり0.06)を「上の見出し」から読み取ります。
表の中に書かれた「確率値」が、この場合の有意水準 5% の片側値 2.5% = 0.025 になる Z 値(表の「見出し」の値)を読み取ります。
見出しが「1.95」のとき確率値(表中の値)が「0.025588」でちょっと大きい
見出しが「1.96」のとき確率値(表中の値)が「0.024998」でちょっと小さい
でも「1.96」のときの方が「0.025」に近そう、ということで
Z ≒ 1.96
と読み取っています。
(ある程度統計をやっていると、2.5% が 1.96 というのは、一種の定数のようによく使うので覚えてしまいます)
有意水準は「確率値」であって、その確率値に対応する「統計変数(Z値)」を求めるという操作です。(下記の表の上に書かれている図を見てください)
標準正規分布表(多分、お使いのテキストの巻末にも載っています)
↓
https://unit.aist.go.jp/mcml/rg-orgp/uncertainty …
パソコンの統計ツールなどをお使いの場合には、それを求める「関数」などがあると思います。
汎用のエクセルだと
NORM.INV(確率、平均、標準偏差)
の関数で「累積確率」(-∞~その値までの累積確率)に対する「統計変数(Z値)」が求まります。
上側確率からの Z 値を求めたい場合には 1 - 0.025 = 0.975 を使って
NORM.INV(0.975,0,1) = 1.959964
となります。
関数を使うのであれば、いちいち「標準正規分布」の変換しなくとも、たとえば、検定で使う N(120, 10^2) から直接
NORM.INV(0.975,120,10) = 139.5996
と求めてもよいです。
(ただ、関数を使うと「何をしているのか」が見えなくなるので、アナログながら「標準正規分布表」を使ってイメージを持ちながら勉強することをお勧めします)
No.3
- 回答日時:
3の目とそれ以外という二値モデルで考えています。
本来は6項のディリクレ分布になりますが、入門用の問題なので簡略化しています。何を言いたいかというと、実際にサイコロはある頂点から見ると奇数しか見えない頂点と、偶数しか見えない頂点があり、「半」か「長」かというように目の出現傾向が似かよる(=独立ではない)性質があります。
そのため、イカサマサイコロかどうかの判定は、この問題のように簡単ではありません。あくまで練習用の設定ですね。
さて、
> 分散についてどの様に計算して良いかがわかりません。
標本比率pの平均と分散の求め方の表を添付します。
観測数の期待値は比率pにn数を掛ける、観測数の分散は標本比率の分散にn^2を掛けることで求められます。
たぶん、テキストでは添付図の正規分布近似を使っています。
ただし、正規分布の誤差は対称です。
一方、二値モデルの誤差は本来非対称です。
特に、確率0および1に漸近する部分では非対称性は顕著になります。
そのため、正規分布近似を使うときは、0近傍や1近傍のスケール(尺度)を拡大して正規分布を当てはめます。
それがロジット変換や逆正弦変換になります。
ご質問者が社会人で、実務で使う場合、不良率などは0漸近しているハズです。必ずロジット変換や逆正弦変換が必要になります。
実際にQC検定に出題されています。
分散の計算方法は一つではないことを覚えておくと良いと思います。
> 特に棄却域の決め方、また・・・
両側検定、片側検定の違いですが、これについては他の方が丁寧に説明されていますので、省略します。
No.2
- 回答日時:
サイコロは、正常に作られたものであれば
・「3」の目の出る確率は 1/6
・「3以外」の目が出る確率は 5/6
です。
これを「n 回」投げたときに、「3」の目が出る回数は「確率 1/6 の二項分布」します。
確率 p の二項分布では、n 回試行して r 回起こる確率は
P(n, r) = nCr × p^r × p^(n - r)
で、その期待値は
E = np
分散は
V = np(1 - p)
になります。
これは、「二項分布」を勉強して、一生に一度自分で導出すれば、あとは本やネットで式を確認して使えばよいです(暗記できればそれに越したことはない)。
二項分布
↓
https://bellcurve.jp/statistics/course/6979.html
https://bellcurve.jp/statistics/course/6982.html
(1) 従って、p=1/6、n=720 のときには
期待値:E = np = 720 × 1/6 = 120
分散 :V = np(1 - p) = 720 × 1/6 × 5/6 = 100
になります。
分散が「100」ということは、標準偏差はその平方根の「10」です
(2) おそらく、「試行回数が多ければ、二項分布は正規分布で近似できる」ということを使うのだと思います。
上記の分布で、p=1/6 に対する「有意水準5%」だと、大きい方に外れることも小さい方に外れることもあるので、
・大きい方に 2.5%
・小さい方に 2.5%
を棄却域にします。
つまり「両側検定」です。
「138回」は平均より大きいので、「大きい方の 2.5%」に入るかどうかを調べます。
下記の「標準正規分布表」から、「大きい方の 2.5%」に入るZ値は
1.96
なので、
120 + (10 × 1.96) = 120 + 19.6 = 139.6
ということになります。
「138」はこの範囲内に入るので、「起こり得る」として帰無仮説は否定できないことになります。
つまり、帰無仮説H0:p=1/6 は否定できません。
標準正規分布表
↓
https://unit.aist.go.jp/mcml/rg-orgp/uncertainty …
(3)「対立仮説H1:p>1/6」ということは「H0:p≦1/6」ということで、これに対する「有意水準5%」は大きい方に外れることだけなので、
・大きい方に 5%
を棄却域にします。
つまり「片側検定」です。
上記の「標準正規分布表」から、「大きい方の 5%」に入るZ値は
1.64
なので、
120 + (10 × 1.64) = 120 + 16.4 = 136.4
ということになります。
「138」はこの範囲から外れるので、「起こり得ない」として帰無仮説は否定されます。
つまり、帰無仮説「H0:p≦1/6」が否定され、「95% の信頼度で p > 1/6 である」との判定結果になります。
No.1
- 回答日時:
(1) 事象Xが確率pで生じるような独立試行をn回やった場合に、事象Xがちょうどk回生じる確率は二項分布
B(n,p)(k) = nCk (p^k)((1 - p)^k)
に従う。そして、二項分布B(n,p)の期待値はnp, 分散はnp(1- p)だ。
ということを知らずに自力で導くのは、難しくはないが、それなりに大変。
(2) 「対立仮説」 は「検定仮説」と対になる用語で、ネイマン・ピアソンの検定法に出てくる。一方「帰無仮説」はフィッシャーの検定法の用語で、こちらでは「対立仮説」なんてものはない。(そして、論理的にはネイマン・ピアソンの検定法はマルデダメ。)…というイチャモンはちょっと置いといて:
「H0が成り立っているのに偶然、kが138=(120 + 18) 回以上、あるいは102=(120 - 18) 回以下になる確率」を計算して、これがもし5%以下なら「危険率5%でH0は棄却。なので(H0の否定である)p≠1/6」が結論。また、もし5%より大きいなら「危険率5%でH0は棄却できない(何も言えない)」が結論。
というルールを適用して結論を出せってことです。(「危険率」は「有意水準」ともいう。)
しかし真面目に「k=138〜720あるいはk=0~102になる確率」を計算するのは、表計算ソフトを使っても大変。そこで、
B(n,p) 〜 N(np, np(1-p))
すなわち「B(n,p)は(nがソコソコ大きいなら)平均np, 分散np(1-p)の正規分布で良く近似できる」ということを利用し、正規分布表を使う。(正規分布表を使った検定の練習問題はすでにやってあるんじゃないでしょうか。)
(3) 「H0が成り立っているのに偶然、kが138回以上になる確率」を計算して、これがもし5%より小さいなら「危険率5%でH0は棄却し、H1」が結論。また、もし5%より大きいなら「危険率5%でH0は棄却できない(何も言えない)」が結論、とやれというのが出題者の意図なのだろうと思う。
でもこれはおかしな話で、H0が棄却されたからってH1を結論にする理由はない。H0を棄却した場合に言えるのは「H0ではない」ってことだけです。
そこで正しく(すなわち、勝手な「対立仮説」なんてものを持ち出すことなく)やるには、
H2: p≦1/6
という帰無仮説を検定する必要がある。どうやって検定するかというと、「H2が正しいとき、たまたま最もpが大きかった場合(つまりp=1/6の場合)ですら、kが138回以上になる確率は5%以下になるかどうか」を調べるんです。
なので計算のやり方は、結局「意図」の話と全く同じで、kが138回以上になる確率」を計算する。ただしここからが微妙に違っていて、もし計算結果が5%以下なら「危険率5%以下でH2は棄却。だから(H2の否定である)p>1/6」が結論。また、もし5%より大きいなら「危険率5%以下でH2は棄却できない(何も言えない)」が結論。(これを「片側検定」と呼ぶ。)
ここで(2)とは違って、すなわち「危険率5%」じゃなくて「危険率5%以下」という表現になるのは、「たまたま最もpが大きかった場合ですら5%なんで、pが最大ではない場合には、もっと小さな危険率になるはず」ということを意味しています。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 統計学の質問です。 どなたか分かる方教えて頂けたら幸いです。 共通]下記の仮説の真偽を判断するため, 2 2021/12/21 18:13
- 統計学 統計学の問題です よろしくお願いします 区間推定 母集団は正規分布に従い,母分散は σ2 = 112 1 2023/01/31 18:57
- 統計学 統計学の問題です。よろしくお願いします。 あるサイコロを3回投げると,1の目が2回出た。 1の目が出 8 2023/01/19 03:37
- 統計学 統計学の問題です。よろしくお願いします。 あるサイコロを3回投げると,1の目が2回出た。 1の目が出 4 2023/01/19 15:21
- 統計学 大学の統計学の問題です。ご回答をよろしくお願いいたします。 2 2021/11/10 23:34
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 [至急] 大学の統計学の問題なのですが,よろしければ模範解答を教えていただきたいです。確率分布の中で 2 2021/11/30 15:07
- 統計学 テキストの解答が間違っているのか、私が間違っているのか 5 2021/12/14 16:00
- 統計学 統計学の質問【帰無仮説】 大学で、現在の在籍者の平均通学時間が60分であるという帰無仮説を、それが6 8 2023/05/23 20:56
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
このQ&Aを見た人はこんなQ&Aも見ています
-
性格の違いは生まれた順番で決まる?長男長女・中間子・末っ子・一人っ子の性格の傾向
同じ環境で生まれ育っても、生まれ順で性格は違うものなのだろうか。家庭教育研究家の田宮由美さんに教えてもらった。
-
統計的検定法について
統計学
-
統計的検定法について
統計学
-
統計的検定法について
統計学
-
-
4
視聴率100%(または0%)の際の誤差について
統計学
-
5
統計的検定法について
統計学
-
6
統計的検定法について
統計学
-
7
チェビシェフの不等式について
数学
-
8
期待値がマイナスの宝くじ
統計学
-
9
確率の計算が出来ないので答えを教えて欲しいです! ①袋の中に9種類の玉があるとして、3つを取り出す時
数学
-
10
数学の確率の問題です
数学
-
11
もう1枚のカードの色
統計学
-
12
確率の達人お願いします
数学
-
13
大きな数の掛け算
数学
-
14
動物の実験のできごとです。7択の問題で、11回連続して間違いが続く確率は、いかほどですか?
統計学
-
15
掛け算について
数学
-
16
確率の達人おねがいします
数学
-
17
製品重量 規格値の設定(公差計算)についての質問
統計学
-
18
数学検定を再受験したい
数学
-
19
−2.5を四捨五入すると−2ですか?−3ですか?
数学
-
20
統計的検定に用いる分布表について
統計学
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
調査結果は、標準誤差率が何%...
-
統計学的に信頼できるサンプル...
-
効果量のマイナス表示に関して
-
T検定とMann-WhitneyのU検定の...
-
アンケート調査のt検定
-
英語論文に出てくる「independe...
-
サンプルサイズの大きく違うF検定
-
統計学 P値
-
有意差検定について
-
統計学 3群間の比較
-
統計論文:ノンパラメトリック...
-
サンプルサイズが極端に少ない...
-
重回帰分析のF検定を教えてく...
-
エクセルのTTESTの使い方
-
項目間の有意差を判定する方法...
-
Fisherの正確確率検定とカイ二...
-
Wilcoxon符号付順位和...
-
実測値と予測値の同異の検定
-
割合の差の検定について教えて...
-
tukeyの多重検定。
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
効果量のマイナス表示に関して
-
統計学的に信頼できるサンプル...
-
調査結果は、標準誤差率が何%...
-
p値の計算式
-
T検定とMann-WhitneyのU検定の...
-
英語論文に出てくる「independe...
-
統計学のP検定とt検定につい...
-
有意差が無いことを証明(危険...
-
サンプルサイズが極端に少ない...
-
サンプルサイズの大きく違うF検定
-
データの分析方法
-
統計のt検定について
-
検定で出てしまった有意差を認...
-
Excelでスミルノフ・グラッブス...
-
スミルノフ・グラブス検定の有...
-
母集団の違う2つの平均値の優...
-
この実験研究に必要な標本人数...
-
2群間平均の差の検定 差が“な...
-
Mann-WhitneyのU検定をspss統計...
-
SPSSで次のようなデータについ...
おすすめ情報
ご回答ありがとうございます。大変わかりやすく噛み砕いて説明いただき感謝です。
ただ、本当に数学が苦手なもので、以下の
120 + (10 × 1.96) = 120 + 19.6 = 139.6
ということになります。
「138」はこの範囲内に入るので、「起こり得る」として帰無仮説は否定できないことになります。
の部分で、「10」は一体どこから現れたのか…と悩んでおります。
また、n=30以上の場合正規分布として扱えることは理解したのですが、その場合標準正規分布表のどこを見れば1.96が導けるのかがいまいちわかっていません。
テキストに0.025は1.96になると書いてあるので最悪それで納得しても良いのですが、できればご教授いただきたいです。
この部分が分かれば今回の質問については全て腑に落ちると思います。
補足お願いできないでしょうか。
よろしくお願いします。