プロが教える店舗&オフィスのセキュリティ対策術

44種類のポスターが同様に確からしく添付されているCDが発売されているという条件で、
(1)CDを44枚買ったときに揃うポスターの種類の期待値を求めよ。
(2)44種類のポスターが揃うまで購入するCDの枚数の平均を求めよ。

(1)は
44枚買って1種類でした
→一回目に44種類のうちどれか選び(44通り)、後はそれのみを選ぶ(1通り) 方法は44×1×1…×1=44通り
従って、44/44^44
44枚買って2種類でした
→一回目に44種類のうちどれか選び(44通り)、次にそれ以外から選び(43通り)、後はそれのみを選ぶ(1通り) 
方法は44×43×1×1×…×1
従って、44×43/44^44
     ・
     ・
     ・
第j種類のポスターが入っている確率は
P(X_j ) = 44-j+1/44^44=45-j/44^44
で,求める期待値は
1×P(X_1)+2×P(X_2)+…+44×P(X_44)
という考え方で合ってますでしょうか?


(2)が分かりません


ご教授頂けますと幸いです
よろしくお願いいたします。

質問者からの補足コメント

  • どう思う?

    ご回答ありがとうございます!
    また、返信遅くなり申し訳ありません。
    クーポンコレクター問題について調べてみました。
    まだ勉強不足なところがあり、申し訳ないのですが、
    今回求める期待値は各期待値がその確率の逆数になることを利用しているかと思います。これって、ベルヌーイ試行の(nCrが付かない)場合の計算に基づいているかと思うのですが、何故今回はnCr(何回目に出たかの概念)がいらないのか、ベルヌーイ試行と二項分布の違いの話だと思うのですが、ご教授頂けると助かりますm(_ _)m

    No.6の回答に寄せられた補足コメントです。 補足日時:2022/10/15 23:43
  • どう思う?

    ご回答ありがとうございます!
    返信遅くなりすみません。先にクーポンコレクター問題について調べている間に質問した問題の出所と思われるサイトを見つけました、、、
    そちらに回答が書かれていたのですが、
    44枚CDを買ったときに,第 j 種類のポスターが入っている確率がP(X_j = 1) = 1-(43/44)^44とあったのですが、なぜこのような式になるのかどうしても分かりません

    No.1の回答に寄せられた補足コメントです。 補足日時:2022/10/16 22:48

A 回答 (12件中1~10件)

Tacosanさんに寄せられた補足ですが、私からも一言。



誕生日問題の方の計算式ですよね。

これは、例えば、
①44個の商品があって、
②1/44の確率で必要な商品が見つかる場合、
③このとき、1個あたりの不要な商品である確率は、(1ー1/44)
④得たい商品が1個でもある確率は、全て不要品の場合の排他だから、
44個の同時確率、(1-1/44)^44 を1から引けば良いです。

これより、44個の商品を調べたとき、その必要な商品が見つかる確率は、

1-(1-1/44)^44=1-(43/44)^44

式の導出は以上です。

ところで、上の式は確率ですから、44種類中何個得られたかという期待値は、44種類を掛ければ良いのです。

これだと44個と44種類と数字がかぶっていますので、誕生日問題であるクラス内の誕生日の出現数の期待値で説明します。
この場合は、44人のクラスで、ひとつも観測されない日付の個数の期待値を算出し、365日から引けば良いです。

365ー365(1-1/365)^44
    • good
    • 0
この回答へのお礼

ありがとう

すごく分かりやすかったです
最初にtacoさんも指摘されてましたが、得たい商品が1個でもある~(たかだか~)で理解しました
日本語難しい…

お礼日時:2022/10/17 18:12

補足です。



365ー365(1-1/365)^44

において、
(1-1/365)^44 は一度も観測されない日付がある確率。
365(1-1/365)^44 は365日中、それが何日あるかの期待値。
これを365日から引けば、出現している日付が何日あるかの期待値になります。

ただし、一度も観測されない日付の方は重複はありませんが、出現している日付については、何か何回重複しているかは全く分かりません。
    • good
    • 0

ああそうか, 「期待値」だから難しいことは考えなくていいんだった.



さておき, 確率が「1 から引いた」形になっているってことは「『そうでない』確率」を考えるとわかりやすい.
    • good
    • 0

> 今回求める期待値は各期待値がその確率の逆数になることを利用しているかと思います。



幾何分布の期待値の導出は、例えばこちら↓。

https://ai-trend.jp/basic-study/geometric-distri …

Wikiの解説は、幾何分布の期待値が1/pになる点は解説不要として端折っています。

続く補足コメントは、何か勘違いをされています。
二項分布、ポアソン分布、幾何分布はベルヌーイ試行がとる分布です。超幾何分布は違います(添付図参照)。

二項分布は、ベルヌーイ試行がn回という有限回でAがx回観測される。
ポアソン分布は、ベルヌーイ試行が無限回で〃。
幾何分布は、ベルヌーイ試行においてx回目にAが初めて観測される。
それぞれのときxがとる分布です。
「期待値について」の回答画像9
    • good
    • 0
この回答へのお礼

ありがとう

ご回答ありがとうございます!
用語勘違いしていました、、、幾何分布の「~回目に初めて現れる」という表現で理解しました。
色々グラフなども提示して下さり助かりましたm(_ _)m

お礼日時:2022/10/16 22:42

#3です。



(2)クーポンコレクター問題のシミュレーションを行いました。

平均値(期待値)はWikiの理論式とほぼ同じ、192.2277 という値になりました。メディアンは183でした。

添付図は、5万回のシミュレーションの結果の分布です。700枚以上購入してもコンプリートできないケースもありました。

#7の投稿は、私の勘違いで、正しくは、

アイテムをコンプリートするまでに必要な抽選回数は、
もし、コレクターが5万人いると、半数の人がコンプリートできる回数は183回だが、
ちっともコンプリートできない人がおり、分布は高い側にすそ野を引くので、平均的には193回である。

でした。
「期待値について」の回答画像8
    • good
    • 1

#3です。



実際に計算してみて思ったのですが、

(1)は、44枚購入するシミュレーションを多数回実施してみたところ、ゲットできるアイテム数が分布を持ち、その平均が28個なので、得られるポスター数の期待値だって理解できるのですが、

(2)は、193枚購入するシミュレーションを多数回してみても、得られるポスター数って44枚が上限ですから、得られるポスター数の期待値って、絶対に44枚にならず、43枚ちょっとなんですよ。

じゃあ、193って数値は何かと言うことなんですが、得られるポスター数のヒストグラムを描いた時に、44枚得られる(コンプリートできる)確率が1/2を越える購入数なんです。つまりメディアン。

これを期待値って言うのか?

延々と購入しないとコンプリートできないケースもあると思うんです。非対称分布です。だから平均はもう少し高い値になるんじゃないかと疑っています。

今、コンプリートしたらCD購入を打ち切る、というプログラムを書いていますので、本当に購入回数の平均が193になるのかどうか、確認してみたいと思います。

他の回答者のご意見も伺いたいです。
    • good
    • 0

#3です。



引き続いて、クーポンコレクター問題の解です。
各アイテムの出現確率が同一の場合は簡単に解け、導出はWikiに出ています。

くじの回数をT、アイテムの数をn、空くじなしとすると、全てのアイテムをコンプリートするまでの抽選回数の期待値E(T)は、

E(T)=n・(1/1 + 1/2 + ・・・+1/n)

です。

これで計算すると、E(T)=192.3999

よって、193回の抽選というか、「193枚のCDを購入」ということになります。
この回答への補足あり
    • good
    • 0

#3です。



誕生日問題の理論値です。

dを日付の個数(365とか)、hを生徒数とすると、「一度も現れない日付の個数」の期待値mは、

m=d(1ー1/d)^h

となります。導出は先に挙げたテキストにあります。

d=44、h=44 で計算すると、m=16.00099
つまり、手に入らないアイテムの期待値は16個、逆に手に入るアイテムの期待値は44-16=28個となります。

これは、コンピュータシミュレーションでも確認済みです。言語はRです。
添付図は1万回のシミュレーションの結果の分布です。平均は28です。

~~~~~~~~~~~~~~~~~~~~~~~~

# 誕生日問題

# 新しい誕生日が見つかったら新しくkに加える、
# この試行を生徒数分行い、
# kの中身が何個になったかを数える。

# これを多数回行うシミュレーション

rm(list = ls())

d <- c(1:44)
h <- 44

sk <- NULL
j <- 0

while(j < 10000){

k <- 0

for(i in 1:h){
x <- sample(d, 1)
if(!x %in% k) k <- append(k, x)
}

sk <- append(sk, length(k)-1) # k=0を取り除く
j <- j + 1
}

bins <- seq(-0.5, max(d)+0.5, by = 1)
hist(sk, breaks = bins)

mean(sk)

# 理論値

max(d) - max(d) * (1 - 1/max(d))^h
「期待値について」の回答画像5
    • good
    • 0

(1) についてもう 1つヒント. たぶん, 「期待値」をそのまま考えるよりも


44-期待値 (または 45-期待値)
の方が考えやすい.

小さい数字を使ってちょっと試してみたけど, 最終的な結果はすごく簡単な式にまとまると思う.
    • good
    • 0

Tacosanさんがおっしゃるように、(2)は「クーポンコレクター問題」です。


日本では、「コンプガチャ問題」とも言いますね。社会学では別の意味らしいけど。
これは計算機が無いと解けませんね。

(1)は「誕生日問題」と言います。その亜流ですね。
40人のクラスで、40人とも別の誕生日ということはまれで、どれだけ重複があるか、という問題です。

ググれば答えが出てくると思いますが、23人の説明しか見つからなかったときは、

数学セミナー編集部編(1999):「数学100の問題」,日本評論社,p59

に解説があります。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!