
「Newton」2022年7月号の「パズルで身につく数学的思考」という特集のひとつ「コイン投げ100回分の結果が二つある。ねつ造された結果はどっち?」という記事です。
まず、こんなエピソードが紹介されます。
とある大学教授が、コインを投げてその結果を記録して提出するという宿題をだします。
しかし、中には結果を捏造して提出した学生がおり、それらを教授は統計解析によって見抜いた、という内容です。
さてここで問題、以下100回コインを投げた結果の図とした場合、AとBどちらが捏造された結果か?というクイズです。
図では●が表、○は裏で、左から右、上から下に記録されています。
<A>
●○●●○●○○○●
●●○●○●○○●●
○○●○○●●●○●
●●○●○●○○●○
○○●●○●●●○○
●○●●○○○●○○
○●●○○●●○○●
●●○●○○○●○●
○●○○●○○●○●
●●○●○○●○○○
<B>
○●●○●●●●●○
○●○●○●●●○●
○○●○●●○●○○
○●○●○○○●○●
○●○○●○●○●●
●○○●●●●○○●
○○○○○○○●○●
●○●○○○●●○●
○●○○○●●●○●
●●●○○○●○○●
わたしの質問は、クイズの答ではありません。答えはAです。
解説記事はこうなってます。●の連続に着目すると、Aは最大3連続、Bは5連続。一見Bは連続し過ぎの様に感じられますが、そうではない、というのがこの記事のポイント。
解説には、こんな表がついてます。100回コインを投げた場合、最大k連続になる確率は何%かという内容です。(最大k連続とは、k回の連続があり、k+1回以上の連続は無いという意味)
k=3:3%、k=4:16%、k=5:26%、k=6:23%、k=7:15%、k=8:8%、k=9:4%、k=10:2%
(K=0~2は0%)
この表から、コインを100回投げて最大3連続になる確率は3%、最大5連続は26%です。
つまりAの方が、まれな結果だから、捏造だそうですが・・・
えらく、おおざっぱな統計解析だと思いませんか?
●の連続だけで、○の連続は考慮しなくてよいのか。
●の連続で検定アウトになったから、もう○は考えなくて良いというのでしょうか。
そもそもランダム性の検定は、最大連続数だけでよいのか、とか。
Aのほうが怪しいというのは、なんとなく感じますが、解説記事が納得できない。
誰かもっとましな検定をしていただけないでしょうか。
No.6ベストアンサー
- 回答日時:
#1です。
>適合度検定のケースで、このような連続発生の個数の適合度を使うのか、は賛否両論でしょう。
これはもちろん、ご質問者様ご指摘のとおり白丸の連続発生についても考慮しなければならないのは当然ですね。でも、かの解説では見落としていますね。
一方、区間の集計値であれば、黒丸の値は白丸の排他ですので、黒丸だけの評価で良いと思います。
ただ、現時点、私は回答できないのですが、
・白の連続数+黒の連続数、という検定では両者の発生数が独立かどうか、自由度がどうなるか、考えないといけませんね。
・同様に、横集計、縦集計の検定でも、両者の合計値に線形制約が入りますので自由度の議論が必要ですね。考えてみたいと思います。
>もっとましな検定をしていただけないでしょうか。
是非、やってみたいと思います。
>是非、やってみたいと思います。
期待しています、
が、時間切れの様です。1週間たちました。
このままだと、運営によって勝手に締め切られてしまいます。
残念ですが、いったん締め切りましょう。
No.7
- 回答日時:
単回確率 q で起こる独立反復事象が
n 回目までに m 連続で起こる確率 Pm(n) は、
Pm(1) = Pm(2) = ... = P(m-1) = 0,
Pm(m) = q^m,
n > m のとき Pm(n) - Pm(n-1) = { 1 - Pm(n-m) }(1 - q)q^m.
で与えられる。
q, m が所与ならば、この漸化式は線形漸化式なので
m次方程式を解くことができれば、解ける。
連続する確率の計算は、記事に書いてありました。
確率自体には間違いはないですが、果たして、ちゃんとした検定になってるのか、ということです。
No.5
- 回答日時:
#1です。
適合度検定のケースで、このような連続発生の個数の適合度を使うのか、は賛否両論でしょう。
と書きましたが、理由は、発生している「位置」について考慮していないからです。もし、後半にまとめて連続発生していたら、どうするのでしょうかね。
だから、縦横集計とかスイープとかが必要になるというわけです。
一様性を見るときは、空間にいくつもランダムに線を引き、そこに射影された密度を見ます。「どの任意の直線に射影しても一様である」これが正論だと思いますが、如何でしょうか。
No.3
- 回答日時:
一つの検定だけで答えられるものではありません。
しかも100回とサンプルサイズも小さいですしね。
検定方法は色々あります。
乱数検定やRandomness testで検索してみてください。
参考:電子政府情報セキュリティ技術開発事業 擬似乱数検証ツールの調査開発調査報告書(平成15年2月, 情報処理振興事業協会セキュリティセンター)
https://www.ipa.go.jp/files/000013665.pdf
No.2
- 回答日時:
んーと。
簡単に言うと「この手のものは偏るのが普通」なんだ。Aは綺麗に分布しているので疑わしい。
しかもサンプル数が100という統計を取るには中途半端に少ない。
そこに偏りが生じないはずないでしょ。
……ってことです。
ハッキリ言って「疑わしいだけ」であり、必ずしも捏造と断定できるものではありません。
ぶっちゃけその記事の統計云々は後付けの理由です。
なぜなら……並んでいる順番を縦方向に見てみなよ。
説明と異なる様子が見られるだろ。
・・・余談・・・
この手のサンプル数は最低でも200は必要。
No.1
- 回答日時:
分布への適合度の問題ですね。
本来なら適合度の検定を行いp値を見る必要がありますね。カイ2乗値が下側に外れる「過度の一致」という状態になります。
メンデルのえんどう豆の遺伝の実験が、捏造だとされたのが有名ですね。
適合度検定のケースで、このような連続発生の個数の適合度を使うのか、は賛否両論でしょう。
このケースの適合度の検定であれば、縦横の集計値を使います。
1行が10個なので、10個同時にコイン投げを行ったのと同じで、それを10試行行っているので、各試行の発生数の二項分布への適合度を調べるという方法を、縦方向・横方向に適用します。
しかし、このような狭い空間だと、1試行あたりの期待度数を5とするのか、全観測値の平均を使うのかで、自由度を含めた計算が変わりますので、その点にも注意が必要です。(というか、かの解説は乱暴すぎます)
あるいは、3×3領域の発生数について、1個ずらしながらスイープしたときの適合度を見る方法もあります。これも同様に期待度数をどうするかという問題はあります。
一方、捏造かどうかではなく、ランダムかどうか、という視点だと、評価はどうなるかは微妙です。
ランダム性の検定というか、「一様性の検定」という方法論があります。
一様度を表す指標、「ディスクレパンシー」という数値もあります。その指標を2者間で比較する方法もあります。
また、これが2値ではなく連続値なら、10次元の配列と考えて主成分分析を行えば、本来あるはずの無い因子負荷量が出てきます。その大きさを比較する方法もあります。(この行列は正則ではないので、もっと行数が必要ですが。)
いずれにしろ、興味深い問題ですので、今度の休日に取り組んでみたいと思います。問題提起、ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 コインの確率について 3 2022/10/18 20:00
- 数学 【 数Ⅰ 仮説検定 】 3 2023/02/27 22:21
- 数学 コインを投げて特定のパターンが出現する確率 5 2022/07/31 09:06
- 統計学 統計学、仮設検定に関して質問です 2 2022/10/28 18:49
- 統計学 学業成績に関する重回帰分析の見方について 4 2022/06/06 17:19
- パチンコ・スロット パチで7日で4万負けなんですが 内容が酷いw ボーダー→ かなり上回ってる 初当たり→ かなり良い 7 2022/04/27 17:59
- 数学 相変わらずヘッタクソ!! A君とB君はコインを1枚ずつ投げ、2枚とも表あるいは2枚とも裏が出れば投げ 5 2023/02/06 13:35
- 数学 コインは何回投げられますか(その2) 6 2023/04/11 20:41
- 数学 A君とB君はコインを1枚ずつ投げ、2枚とも表、あるいは2枚とも裏が出れば、投げた2枚をA君がもらい、 3 2023/02/05 12:19
- 数学 コインは何回投げられますか。 2 2023/04/19 20:59
今、見られている記事はコレ!
-
弁護士が語る「合法と違法を分けるオンラインカジノのシンプルな線引き」
「お金を賭けたら違法です」ーーこう答えたのは富士見坂法律事務所の井上義之弁護士。オンラインカジノが違法となるかどうかの基準は、このように非常にシンプルである。しかし2025年にはいって、違法賭博事件が相次...
-
釣りと密漁の違いは?知らなかったでは済まされない?事前にできることは?
知らなかったでは済まされないのが法律の世界であるが、全てを知ってから何かをするには少々手間がかかるし、最悪始めることすらできずに終わってしまうこともあり得る。教えてgooでも「釣りと密漁の境目はどこです...
-
カスハラとクレームの違いは?カスハラの法的責任は?企業がとるべき対応は?
東京都が、客からの迷惑行為などを称した「カスタマーハラスメント」、いわゆる「カスハラ」の防止を目的とした条例を、全国で初めて成立させた。条例に罰則はなく、2025年4月1日から施行される。 この動きは自治体...
-
なぜ批判コメントをするの?その心理と向き合い方をカウンセラーにきいた!
今や生活に必要不可欠となったインターネット。手軽に情報を得られるだけでなく、ネットを介したコミュニケーションも一般的となった。それと同時に顕在化しているのが、他者に対する辛らつな意見だ。ネットニュース...
-
大麻の使用罪がなかった理由や法改正での変更点、他国との違いを弁護士が解説
ドイツで2024年4月に大麻が合法化され、その2ヶ月後にサッカーEURO2024が行われた。その際、ドイツ警察は大会運営における治安維持の一つの方針として「アルコールを飲んでいるグループと、大麻を吸っているグループ...
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
外イキはなぜ1回しか出来ないの...
-
真面目に質問します。 クリで連...
-
王の大ホームランや右以外のホ...
-
隔年と毎年の違いを教えてくだ...
-
自動紙送り装置
-
1日あける 一日置き 違いは何で...
-
「区分的に連続」と「区分的に...
-
エクセルで同じ文字が3連続して...
-
連続投稿はできません。しばら...
-
連続する2整数が互いに素(最大...
-
数学の問題です。 ある連続する...
-
無理数は連続ですか?
-
ジャンケン連勝世界記録
-
数学
-
連続する番号を引く確率
-
算数-整数の和
-
2週間連続で夕飯にそうめんを食...
-
ε-δ論法による関数の連続性につ...
-
x^2sin(1/x) と 0(x=0) での連続性
-
連続する3つの整数の積が6の倍...
おすすめ情報