アプリ版:「スタンプのみでお礼する」機能のリリースについて

硬貨を投げて表が出た枚数を相対度数折れ線グラフに書いたものなのですが、このグラフからなぜBのほうが出
https://oshiete.goo.ne.jp/qa/12829561.html

という質問が3月1日に出ましたが、この問題の出展を知りたいです。話題のネタとして知っておきたいのです。

理由は、20~30回程度の試行では「Bの方が出やすいとは言えない」というのが答えだからです。
あるいは、それぞれの試行数を100回とかに増やしてやれば、差が認められますが、本来差が無いものを、観測数を増やして差があると言う論旨は、今日認められないことです。

なお、上記の結論は、Aの観測度数を基準としたBの逸脱有無を、「カイ2乗適合度の検定」を行い確認しました。

質問者からの補足コメント

  • Bの観測度数を基準としてAの逸脱を見ています。Aには観測度数0があるので、基準にはできません。また、0漸近しているので、warningが出まくっています。フィッシャーでやり直しています。

      補足日時:2022/03/03 02:16
  • これは、5枚のコインを同時に投げ、表の枚数を数えるという試行を、何回か繰り返したものかと思われます。本来は、二項分布からの逸脱を見るべき問題かとも思いますが、どうせ棄却されないでしょうから、2者比較としました。

      補足日時:2022/03/03 02:20
  • 試行数が30回前後だと想像した理由は、最小の相対度数がBの約0.03だからです。これは30回中1回生起する程度の値です。

      補足日時:2022/03/03 07:51

A 回答 (2件)

No.1へのコメントについてです。



> この手のトンデモ問題&回答があるというのを、仲間うちの話題にしたかった

 単に「コタエが間違っとる」というだけではなく、話の設定の不自然さ自体もツッコミどころとして論点にする、というご趣旨でしたか。デタラメ教えてる「教育」商売が世に横行し、大企業の社員全員まとめてヒッカカってる例も多々あるようで、もう笑いごとじゃない。

 p値については避けて通る通らない、という心配は無用でしょう。簡単な話で、単に「統計と決断は別だ」というだけのことです。
 統計で例えばp=0.6の結論が出たとして、「普通はα=5%とかせいぜい10%ですから、p=0.6なら棄却できません」だなんて統計が口を出すのは全くの筋違い。その話に乗るか乗らないかは、統計ではなく現実世界での決断の問題だからです。
 もちろん、p=0.6から利得の期待値を計算したってダメで、ハズレた時のダメージ(夜逃げかも)、アタった時のメリット(起死回生かも)、さらには運の良さだの日頃の信心だのを勘案し、覚悟を決めた上で責任を持って決断する。(実際、商店街の福引きでハズレの確率が0.99でもガラガラに並ぶのは、ハズレた時のダメージってのが、少々の時間を失うけれど多少のドキドキ感は楽しめる、という程度だから。)また、「先に有意水準を決めてから検定しろ」だなんて、ただの儀式にすぎません。肝心なのは、「pが[受け入れられる限度の確率α] より桁違いに小さいのならともかく、もしギリギリのp値が出たらダメージ・メリットの見積もりをもっと精密にやり直せ」ってことです。
 決断に関して、「統計の結果の応用」という文脈で教科書が全く説明しないわけには行かないだろうけれども、それはすでに統計の範疇ではない、ということは(Fisherだって下手な話の仕方をしちゃったと後悔したわけで)十分に強調されるべきだと思います。

 ピーチパラノイアについては、さすがにマルマル捏造する奴は少なくて、やっぱり一番多く見られるのが、「あ、この実験は失敗だからノーカウント」という選別です。自覚がなくて「実験を繰り返すこと苦節十年、ついに有意差を得た」とか言っちゃう人が結構いる。
    • good
    • 0
この回答へのお礼

ありがとうございます。

この手の問題は「教えてgooに出たトンデモ問題」という発表資料にして、社内の啓蒙とかに使っています。「教えてgooで回答炎上」とかも使えます。

運営削除になりましたが、数日前の、「直径、長さ、質量から密度を求めなさい」なんて問題は、密度が体積依存しているという、思わずニンマリしてしまう問題でしたので、早速使わせてもらって、内生性バイアスの資料を作りましたよ。

決断とかの話はごめんなさい。ノーコメントです。

お礼日時:2022/03/03 07:30

Link先を拝見しましたが、なるほど、これはヘンテコなシロモノですね。

しかし、「話のネタ」には向かないと思います。

 第一に相対度数が書いてあるのにN数が書いてない。なので、質問者氏は2項分布からのズレをもとにN数を推定する、という作業をわざわざなさって「20~30回程度の試行」とおっしゃっているのでしょう。しかし、現実のデータにおいてN数不明だなんて、そんなことはアリエンでしょう。

 第二に、なんで横軸が0〜5なのか。「2枚のコインA, Bをそれぞれ5回投げる」という試行を「1セット」として、これをいっぱい繰り返した、とでも解釈するしかないが、そんなことフツーはやらんでしょう。5回で1セットだなんて恣意的な括りをやる意味も根拠もない。単にコインAとBを投げるという試行をいっぱい繰り返す、というのがフツーであり、だから得られるデータはA,Bそれぞれについて、表が何回、裏が何回、という4個の数値に集約される。
 「いやこれはA群5枚とB群5枚同士の比較なんだ」ということなら、それら10枚についてそれぞれデータを取って、A群の「表が出る相対度数」5つとB群のソレを比較する。だからどっちみち、横軸が0〜5のグラフに出番はない。

…というわけで、かなり不自然でフツーでない、言い換えれば「作った話」のような印象です。さらに、そもそもナニをドウやって取ったデータなのかが明示されていないんで、もしアノ場合なら、もしコノ場合なら、と論点が広がって焦点がボケるのがいやらしい。
 ですからこんなもの、「話のネタ」には向かないのでは?


余談ながら、

> 本来差が無いものを、観測数を増やして差があると言う論旨は、今日認められない

 「本来差が無い」と分かっているものの場合ならば、「今日認められない」どころではなく、そもそも試行をやる理由がないからナンセンスです。
 一方、素粒子物理実験などでやってるのは、「わずかながら差があるかもしれない、ないかもしれない」というものを相手にして、思ったより差が小さいくてNが足りない、という事態になればNを増やす。そうやって、信頼度 0.999999 というレベルで答を出している。これを認めない訳にはいかないでしょう。
 もちろん「有意差アリになるまで試行を繰り返し、有意差アリになったら即座にやめる」というイカサマが理論上は可能ですが、試行回数が滑稽なほど膨大になる。現実に行われているのは、そんなやり方ではないでしょう。むしろ、試行回数を(大体)固定した実験を「1セット」として、これを有意差アリのセットが現れるまで繰り返し、有意差アリが出たらそれを発表する。そして、他のセットのデータは無かったことにする。(上記の「5回で1セット」というのでは、このイカサマにすら使い物にならんわけですが。)
 とは言っても、必ずしも作為的にデータを選別しているのではなく、発表バイアスが自動的にその働きをする。すなわち、たくさんの研究者が同じような実験をやる場合、有意差ナシのセットを得た研究者はその結果を滅多に投稿しないし、掲載も滅多にされない。しかし、「有意水準 1% で有意差アリ」ってのは研究者100人がやれば1回ぐらいはマグレで出る。だから、どいつもこいつも似たような安易で凡庸な研究ばっかりやってる分野では、マグレ論文が投稿されやすくなる。それで分野によっては「検定やるな、p値を書くな」などと血迷ったことを言い出しているわけですが、それは単に、査読者も含めてその分野全体の科学哲学と統計に関するリテラシーのレベルが低いからじゃないかなあ…という昨今。
    • good
    • 0
この回答へのお礼

ありがとうございます。

リテラシーのレベルで言ったら、この問題がそうで、現在世間で流行っている、データサイエンティスト養成コースみたいな商売で使われているテキストかなあと思っています。これが文科省検定の教科書だったら大ごとです。

裏映りしている文字が、小学生の問題集では無く、大人向けの「○○士」の問題かと思った次第です。どんな本、あるいは講習会なんでしょうかねえ。


で、この手のトンデモ問題&回答があるというのを、仲間うちの話題にしたかった、という次第です。
他にもざくざく出てくるかもしれませんよ。笑えますよ。

あと、p値問題は、分かっちゃいるけど、統計屋をやっていると避けて通れません。出版バイアスもそうですが、スタップ細胞のような成果を出そうとするピーチパラノイアも居ますからねえ。

お礼日時:2022/03/03 02:46

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!