アプリ版:「スタンプのみでお礼する」機能のリリースについて

数学の「確率」に詳しい人がいらっしゃいましたら教えてください。
確率とはその母集団の多い少ないに関係なく、ある程度の正確性というかデータの確実性が成立しますか?
例えば、母集団が1万人の中の確率と10人の確率でもデータの精度に変わりはありませんか? それとも精度に差は出ますか?

この前、テレビでお酒の強い弱いの話題が触れられていました。

①たくさん飲めて顔も赤くならないタイプ(アルデヒド分解酵素とアルコール分解酵素が両者活性型) 日本人の56%がお酒が強いこのタイプ
②少量のお酒で顔が赤くなるタイプ(アルデヒド分解酵素が不活性型でアルコール分解酵素は活性型) 日本人の40%がお酒が弱いこのタイプ
③お酒自体が飲めない下戸タイプ(アルデヒド分解酵素とアルコール分解酵素が両失活型) 日本人の4%がお酒が強いこのタイプ

という割合になるそうです。強い:弱い:下戸という比率は日本人だと56:40:4で、この比率に男女差は全く無いそうです。

「確率」で考えた時、例えば日本人の全人口の女性で考えた時に、強い:弱い:下戸という比率=56:40:4ということになるんだと思いますが、例えば、女子大のとあるゼミナールに属するゼミ生の女子大生10人の集団でも同じ比率(56:40:4)になる可能性が高いということですか?

また、例えば大手企業の楽天グループの正社員の日本人女性は合計しても1000人以上はいると思いますが、楽天グループの正社員の日本人女性という母集団だと同じ比率(56:40:4)になる可能性は大きいと思いますが、それぞれの部署に所属する女性社員でも同じ比率(56:40:4)になるということですか?


数学に詳しい方がいらっしゃいましたら教えてください。
お願いします。





======================
<記事1>
実は、日本人の約4割は、生まれつき「飲めない族」、つまりアルコールをまったく受けつけないか、少量飲めても悪酔いしやすい体質なのです。
体質の違いを決めるのは、「ALDH2」という酵素の働き方。
酒類に含まれるエチルアルコールは、肝臓で分解されると毒性の強い「アセトアルデヒド」になります。この物質は頭痛や吐き気、動悸などを引き起こします。このアセトアルデヒドを分解して酢酸に変える酵素のうち、いちばんの働き者がALDH2なのです。
ALDH2がうまく働かないと、アセトアルデヒドが体内にたまって苦しい思いをします。
これが「飲めない族」。一方、残りの6割の「危ない族」、つまり飲んでも悪酔しない人は、ALDH2の働きでアセトアルデヒドがどんどん分解され、頭痛や吐き気などをあまり経験しません。 そのかわり、アルコール依存症や内臓疾患にかかる可能性が高いから「危ない族」なのです。
自分の体質を正しく理解し、また他人の体質を尊重して、飲み過ぎや無理強いはやめましょう。

https://www.ask.or.jp/article/532


<記事2>
顔が赤くなる人とならない人の違いは?
「お酒を飲むとすぐに顔が赤くなる人と、赤くならない人」がいますが、その違いの理由は何だかわかりますか?顔が赤くなるか、ならないかの違いは、遺伝的に決まっているんです。日本人の遺伝子を調べてみると、44%の人は、少ない量のお酒ですぐに顔が赤くなる、お酒に弱い体質なんです。これは、アルコールを分解する酵素の働きが、遺伝的に弱いか、欠けているんです。

https://www.tbsradio.jp/archives/?id=p-290280


<記事3>
体内に入ったアルコールの約9割は肝臓で代謝される。その際、アルコール脱水素酵素によって、アルコール(エタノール)はアセトアルデヒドに分解。その後、『アセトアルデヒド脱水素酵素』により、アセトアルデヒドは無毒な酢酸になり、肝臓から排出される。このALDHのうち、ALDH1とALDH3は、個人差が少ないが、ALDH2は個人差が非常に大きく、その差が酒に強いか弱いかを決めるカギを握っているのだ。

ここできちんと3タイプの違いを知っておこう。

ALDH2が安定で正常な動きをするのが「活性型(NN型)」。両親から、分解能力が高いとされるN型を受け継いだ人だ。自他ともに認める酒豪で、酒を飲んでも赤くならないノンフラッシャーがほとんど。

2つ目は「不活性型(ND型、低活性型と呼ぶ場合もある)」。分解能力が高いN型と、分解能力が低下したD型をそれぞれ引き継いだタイプで、まったく飲めなくはないが、基本的には酒に弱くなる。普段からアルコールに親しんでない場合、顔も赤くなりやすい。

3つ目はALDH2が完全に失活した「失活型(DD型)」。両親からD型を引き継いだタイプだ。酒に弱いどころか、まったく飲めないといったほうが正しく、ほとんどの場合がフラッシャー。奈良漬けを食べた程度でも真っ赤になってしまうのがこのタイプだ。
https://style.nikkei.com/article/DGXMZO08006770U …
======================

A 回答 (2件)

No.1 です。

少し質問に即して。

>確率とはその母集団の多い少ないに関係なく、ある程度の正確性というかデータの確実性が成立しますか?

質問者さんは、「現実のデータを処理して得られる割合」と「限られたサンプルから推定した未知の集団の特性」を混同しているようです。

1万人だろうが、10人だろうが、そのデータを調べたものは「真実」です。
1万人を調べて感染者が 673人だったら、感染率は
 673/10000
です。誤差も精度もない、正確な数値です。
10人を調べて感染者が3人だったら、感染率は
 3/10
です。誤差も精度もない、正確な数値です。

質問者さんが問題にしているのは、
10人の調査データから推定した日本人全体(1億人ちょっと)の感染率と、
1万人の調査データから推定した日本人全体(1億人ちょっと)の感染率とで
どちらの精度が高いか、という話ですね?
だったら、当然 1万人の方が精度が高いでしょう。
一般に、データ数が多いほど「バラツキ」を小さくできるからです。
一般に、データ数を n 倍にすると、バラツキを 1/√n にできます。


ただし、これらの「推定」をする上で、サンプルは「無作為抽出」する必要があります。「ランダム」でなければ「確率」という概念が使えません。
男子校で「男女のデータ」をとっても、「全員男性」というデータしか得られませんから。
そういう意味で、「電話での世論調査」では、「知らない人からの電話に出る」割合は、確実に「家電」で「年寄り」が多いはずなので(若い人はスマホのLINEやメールが主体で、ほとんど電話には出ない)、そこで収集したデータの「公平性」「客観性」には問題があります。

お書きになっている「お酒の強さ」のデータにしても、それぞれのデータが、どのような対象集団に対して、どのようなやり方で、それだけのサンプル数で調査したのかが分からなければ、客観性や一般性(どこまで他の集団に広げて適用できるか)は疑問です。
ましてや「女子大生 10人で調べた」など、客観性や一般性のないデータ(特殊なデータ)を持ってきて議論しても、ほとんど意味がありません。
(日本人の一般論をその10人に適用することも、その10人のデータから日本人全般を議論することも)
    • good
    • 0

「確率」と「実際の実現数(その都度のバラツキあり)」では当然意味が異なります。



「確率」はある意味では「無限大のサンプルをとって来て計算した」あるいは「全数調査して調べた」値のようなもの。
ただし、そのようなものが現実的は数え上げられない。
従って、ある程度のサンプルから「推定、類推」するのがふつう。
当然のことながら「別なサンプル」をとってくれば、通常は一致しない。

そこに使われている統計データは、どのような出典、算出方法、さらには信頼性・信憑性をきちんと確認する必要があります。

「統計で人をだます」ことが簡単にできることは、下記のような書籍がたくさん出ていることからも分かります。

「統計でウソをつく法―数式を使わない統計学入門 」
https://www.amazon.co.jp/%E7%B5%B1%E8%A8%88%E3%8 …

「統計はこうしてウソをつく―だまされないための統計学入門」
https://www.amazon.co.jp/%E7%B5%B1%E8%A8%88%E3%8 …

「統計という名のウソ―数字の正体、データのたくらみ」
https://www.amazon.co.jp/%E7%B5%B1%E8%A8%88%E3%8 …

「ウソを見破る統計学―退屈させない統計入門」
https://www.amazon.co.jp/%E3%82%A6%E3%82%BD%E3%8 …

「ニュースの数字をどう読むか ――統計にだまされないための22章」
https://www.amazon.co.jp/%E3%83%8B%E3%83%A5%E3%8 …

「統計で騙されない10の方法」
https://www.amazon.co.jp/%E7%B5%B1%E8%A8%88%E3%8 …
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!