
「Newton」2022年7月号の「パズルで身につく数学的思考」という特集のひとつ「コイン投げ100回分の結果が二つある。ねつ造された結果はどっち?」という記事です。
まず、こんなエピソードが紹介されます。
とある大学教授が、コインを投げてその結果を記録して提出するという宿題をだします。
しかし、中には結果を捏造して提出した学生がおり、それらを教授は統計解析によって見抜いた、という内容です。
さてここで問題、以下100回コインを投げた結果の図とした場合、AとBどちらが捏造された結果か?というクイズです。
図では●が表、○は裏で、左から右、上から下に記録されています。
<A>
●○●●○●○○○●
●●○●○●○○●●
○○●○○●●●○●
●●○●○●○○●○
○○●●○●●●○○
●○●●○○○●○○
○●●○○●●○○●
●●○●○○○●○●
○●○○●○○●○●
●●○●○○●○○○
<B>
○●●○●●●●●○
○●○●○●●●○●
○○●○●●○●○○
○●○●○○○●○●
○●○○●○●○●●
●○○●●●●○○●
○○○○○○○●○●
●○●○○○●●○●
○●○○○●●●○●
●●●○○○●○○●
わたしの質問は、クイズの答ではありません。答えはAです。
解説記事はこうなってます。●の連続に着目すると、Aは最大3連続、Bは5連続。一見Bは連続し過ぎの様に感じられますが、そうではない、というのがこの記事のポイント。
解説には、こんな表がついてます。100回コインを投げた場合、最大k連続になる確率は何%かという内容です。(最大k連続とは、k回の連続があり、k+1回以上の連続は無いという意味)
k=3:3%、k=4:16%、k=5:26%、k=6:23%、k=7:15%、k=8:8%、k=9:4%、k=10:2%
(K=0~2は0%)
この表から、コインを100回投げて最大3連続になる確率は3%、最大5連続は26%です。
つまりAの方が、まれな結果だから、捏造だそうですが・・・
えらく、おおざっぱな統計解析だと思いませんか?
●の連続だけで、○の連続は考慮しなくてよいのか。
●の連続で検定アウトになったから、もう○は考えなくて良いというのでしょうか。
そもそもランダム性の検定は、最大連続数だけでよいのか、とか。
Aのほうが怪しいというのは、なんとなく感じますが、解説記事が納得できない。
誰かもっとましな検定をしていただけないでしょうか。
No.6ベストアンサー
- 回答日時:
#1です。
>適合度検定のケースで、このような連続発生の個数の適合度を使うのか、は賛否両論でしょう。
これはもちろん、ご質問者様ご指摘のとおり白丸の連続発生についても考慮しなければならないのは当然ですね。でも、かの解説では見落としていますね。
一方、区間の集計値であれば、黒丸の値は白丸の排他ですので、黒丸だけの評価で良いと思います。
ただ、現時点、私は回答できないのですが、
・白の連続数+黒の連続数、という検定では両者の発生数が独立かどうか、自由度がどうなるか、考えないといけませんね。
・同様に、横集計、縦集計の検定でも、両者の合計値に線形制約が入りますので自由度の議論が必要ですね。考えてみたいと思います。
>もっとましな検定をしていただけないでしょうか。
是非、やってみたいと思います。
>是非、やってみたいと思います。
期待しています、
が、時間切れの様です。1週間たちました。
このままだと、運営によって勝手に締め切られてしまいます。
残念ですが、いったん締め切りましょう。
No.7
- 回答日時:
単回確率 q で起こる独立反復事象が
n 回目までに m 連続で起こる確率 Pm(n) は、
Pm(1) = Pm(2) = ... = P(m-1) = 0,
Pm(m) = q^m,
n > m のとき Pm(n) - Pm(n-1) = { 1 - Pm(n-m) }(1 - q)q^m.
で与えられる。
q, m が所与ならば、この漸化式は線形漸化式なので
m次方程式を解くことができれば、解ける。
連続する確率の計算は、記事に書いてありました。
確率自体には間違いはないですが、果たして、ちゃんとした検定になってるのか、ということです。
No.5
- 回答日時:
#1です。
適合度検定のケースで、このような連続発生の個数の適合度を使うのか、は賛否両論でしょう。
と書きましたが、理由は、発生している「位置」について考慮していないからです。もし、後半にまとめて連続発生していたら、どうするのでしょうかね。
だから、縦横集計とかスイープとかが必要になるというわけです。
一様性を見るときは、空間にいくつもランダムに線を引き、そこに射影された密度を見ます。「どの任意の直線に射影しても一様である」これが正論だと思いますが、如何でしょうか。
No.3
- 回答日時:
一つの検定だけで答えられるものではありません。
しかも100回とサンプルサイズも小さいですしね。
検定方法は色々あります。
乱数検定やRandomness testで検索してみてください。
参考:電子政府情報セキュリティ技術開発事業 擬似乱数検証ツールの調査開発調査報告書(平成15年2月, 情報処理振興事業協会セキュリティセンター)
https://www.ipa.go.jp/files/000013665.pdf
No.2
- 回答日時:
んーと。
簡単に言うと「この手のものは偏るのが普通」なんだ。Aは綺麗に分布しているので疑わしい。
しかもサンプル数が100という統計を取るには中途半端に少ない。
そこに偏りが生じないはずないでしょ。
……ってことです。
ハッキリ言って「疑わしいだけ」であり、必ずしも捏造と断定できるものではありません。
ぶっちゃけその記事の統計云々は後付けの理由です。
なぜなら……並んでいる順番を縦方向に見てみなよ。
説明と異なる様子が見られるだろ。
・・・余談・・・
この手のサンプル数は最低でも200は必要。
No.1
- 回答日時:
分布への適合度の問題ですね。
本来なら適合度の検定を行いp値を見る必要がありますね。カイ2乗値が下側に外れる「過度の一致」という状態になります。
メンデルのえんどう豆の遺伝の実験が、捏造だとされたのが有名ですね。
適合度検定のケースで、このような連続発生の個数の適合度を使うのか、は賛否両論でしょう。
このケースの適合度の検定であれば、縦横の集計値を使います。
1行が10個なので、10個同時にコイン投げを行ったのと同じで、それを10試行行っているので、各試行の発生数の二項分布への適合度を調べるという方法を、縦方向・横方向に適用します。
しかし、このような狭い空間だと、1試行あたりの期待度数を5とするのか、全観測値の平均を使うのかで、自由度を含めた計算が変わりますので、その点にも注意が必要です。(というか、かの解説は乱暴すぎます)
あるいは、3×3領域の発生数について、1個ずらしながらスイープしたときの適合度を見る方法もあります。これも同様に期待度数をどうするかという問題はあります。
一方、捏造かどうかではなく、ランダムかどうか、という視点だと、評価はどうなるかは微妙です。
ランダム性の検定というか、「一様性の検定」という方法論があります。
一様度を表す指標、「ディスクレパンシー」という数値もあります。その指標を2者間で比較する方法もあります。
また、これが2値ではなく連続値なら、10次元の配列と考えて主成分分析を行えば、本来あるはずの無い因子負荷量が出てきます。その大きさを比較する方法もあります。(この行列は正則ではないので、もっと行数が必要ですが。)
いずれにしろ、興味深い問題ですので、今度の休日に取り組んでみたいと思います。問題提起、ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報