アプリ版:「スタンプのみでお礼する」機能のリリースについて

統計学を学び始めたばかりの者です。基礎的なご質問ですがどなたかご教示いただけると助かります。
【問題】歪みのない六面体のサイコロを57回投げて、目が1もしくは2の時1という値をとり、目が3から6までの時は0という値をとる確率変数Xを定義すると
①目が1もしくは2の時1という値をとる確率をpとすると、確率変数Ⅹの期待値と分散をpの式で表せ。
②この試行をn回繰り返すと、Ⅹの標本平均がpの標本比率となる。二項分布の期待値と分散の式から、標本比率の期待値と分散をpとnの式で表せ。
③試行結果から標本比率の実現値を計算せよ。
④母比率に関する信頼区間の求め方を述べよ。
⑤この試行結果から、母比率に関する信頼係数95%と99%の信頼区間を計算せよ。
⑥目が1もしくは2が出る割合を母比率pとして、試行結果から次の仮説検定を有意水準5%で行い検定結果を述べよ。帰無仮説:p=1/3  対立仮説:p≠1/3

質問者からの補足コメント

  • すみません。質問の補足を致します。
    問③の試行データを記載しておりませんでした。

    サイコロを57回投げたとき、1あるいは2の目が出たのが17回、3から6の目が出たのは40回だとすると計算はどのようになるのでしょうか?
    稚拙な質問で恐縮ですが、再度ご教示いただけると助かります。

      補足日時:2021/10/29 11:10

A 回答 (4件)

何が、どのように分からないので質問していますか?


すべて、やり方はテキストに書いてあると思います。

① 「1」となる回数の分布は、確率 p の「当たり」が出るくじの「当たり回数」と同じ「二項分布」です。

② 「57回の施行」を「n セット」行うということです。
 上記①を「n 回」やって平均をとることに相当します。

③ 「試行結果から」というのは、何かデータを与えられていますか?
それとも「各自やってみよ」ということ?

④ 標本データから母集団を推定せよということです。

⑤ 上の③のデータを使って④を求めよということです。

⑥ p=1/3 と仮定したとき、④の「95%信頼区間」との比較で「起こり得ない」といえるかどうかを調べます。
    • good
    • 1
この回答へのお礼

助かりました

ご回答いただきありがとうございます。各問いの意図がよく分かりました。
③の与えられたデータを記載してませんでした。すみません。
サイコロを57回投げて、1と2の目が出たのは17回、3から6の目は40回出たとするとどのような計算になるのでしょうか?テキストを何回読んでも混乱してよく理解ができないのです。稚拙な質問で恐縮ですが、今一度ご教示いただけると助かります。

お礼日時:2021/10/29 10:18

問題の解答でなくて、すみません。



設問④ですが、母比率の信頼区間というのは、そうそう簡単に求められるものではありません。Waldの推定方法とAgresti-Coullの推定方法があるのですが、初学者向けの基礎的な問題とは思えません。
(Rなら、一発で求められますが・・・)

99%信頼区間は片側0.5%です。考えてみて下さい。累積確率片側0.5%の点って、どうやって求めるのか、ということです。しかも0個目、1個目と計算していくと、不連続なので、丁度0.5%にならない可能性の方が高いです。何らかの連続関数的な推定方法が必要ですよね。

また、57という大きなサンプルサイズでは、二項分布の式で10のマイナス30乗という桁落ちに近い数値が出きますから、累積値を取りたい確率質量の計算も破綻します。

それらの対策として、正規分布近似を考える場合があります。でも、横軸の値は0~1の範囲です。正規分布は-∞~∞の範囲を取ります。裾野の近似精度は極めて悪いです。(正規分布近似の信頼区間の求め方はネット記事で見かけますが、一方で、ロジット変換や逆正弦変換でやっているサイトもあります。直接求めるアプローチでWaldやAgresti-Coullでやっているサイトもあります。後者が正しいと思います)

少し前に、他の方から、どんな条件であれば正規分布近似できるか、という質問がありましたが、それはまともな問題です。
    • good
    • 0

母比率の信頼区間について、良い説明がありました↓。



https://bellcurve.jp/statistics/course/14835.html

Waldって、正規分布近似だったというのは知らなかったので、ご質問者のおかげで大変勉強になりました。
以後、気を付けようと思います。
    • good
    • 0

#3です。

④信頼区間について、

https://bellcurve.jp/statistics/course/14835.html

このページの最初の計算で分かるように、正規分布近似(Wald)では、信頼上限は1を越えるというあり得ない値になっていますね。
クワバラクワバラ。
まあ、私はRのbinom.testでやっていたのでOKだったですが、知らなかったのはヤバかったです。

で、この問題ではどうしろ、って言うんでしょうかね。出題者の期待感が分かりません。出題者のレベルが私同様怪しいですからね。

このサイトの「ClopperとPearsonの正確信頼区間」の式を丸写しして書いて、計算はExcelでやれば良いのでは。ちゃんとExcelでやったと書いておけば、出題者も勉強するんじゃないでしょうか。

あと、高精度計算サイトってのもありました↓。

https://keisan.casio.jp/exec/user/1490184062

これから、Rでプログラム組んで、検証がてら勉強します。こんな機会が得られたのもご質問者のおかげです。ありがとうございます。
    • good
    • 0
この回答へのお礼

ご回答いただきありがとうございます。
参考にさせていただきます。

お礼日時:2021/11/01 13:09

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!