無作為抽出で平均年齢30歳になる確率

先程質問を投稿したのですが、題名がおかしなものになったので再度同じものを投稿します。お許しください。
小沢さんを強制起訴する旨、検察審査会の議決が出されました。
この検察審査会の11名、平均年齢が30.9歳だそうです。若いのにびっくりしました。選出が本当に無作為に行われたのか、疑問に思います。
そこで質問は、20歳以上の日本人(実際は東京都民なのでしょうが)の年齢構成を前提に、無作為に11名を選んだ時、その平均年齢が30歳以下になる確率はどの程度あるだろうか、という事です。
日本人の年齢についての統計は以下にあります。どうかよろしくお願いします。
http://www.stat.go.jp/data/nihon/02.htm
http://www.stat.go.jp/data/nihon/zuhyou/02syo/n0 …

A 回答 (11件中1~10件)

No.3 です。



この問題のように、ある確率分布を持ったものから、数個のサンプルを取り、
平均値を取るといった操作を繰り返すのは、サンプル数の増加に従い、
急速に正規分布に収束します。
これは、No.10 さんの解説の通り、中心極限定理で保障されています。

ただ、中心極限定理では、平均値と標準偏差の2つの値で
最初の分布を単純化しているため(この2値で決まる、
というのがまたすごい所で、応用範囲が大きいのです。)
条件が整わないと、精度が今一つになります。

というわけで、シミュレーションで数値を出していたのですが、念のため、
数学的に解いてみました。

こういう離散的な確率の足し算は、畳み込み和で表すことが出来ます。

結論から申しますと、n=8760902 (総和)として、

(114764 + 129829 x + 139317 x^2 + 156213 x^3 + 168990 x^4 +
181678 x^5 + 185709 x^6 + 187437 x^7 + 189819 x^8 + 193936 x^9 +
201216 x^10 + 205167 x^11 + 207597 x^12 + 211507 x^13 +
214705 x^14 + 226978 x^15 + 235054 x^16 + 230807 x^17 +
227315 x^18 + 220988 x^19 + 216615 x^20 + 213950 x^21 +
218324 x^22 + 158336 x^23 + 202569 x^24 + 187105 x^25 +
173772 x^26 + 164315 x^27 + 156465 x^28 + 153510 x^29 +
147778 x^30 + 145646 x^31 + 134967 x^32 + 136167 x^33 +
139211 x^34 + 138967 x^35 + 141882 x^36 + 151812 x^37 +
157961 x^38 + 171561 x^39 + 198236 x^40 + 197308 x^41 +
201501 x^42 + 137814 x^43 + 122194 x^44 + 150353 x^45 +
160989 x^46 + 154820 x^47 + 155493 x^48 + 142255 x^49)^11/n^11

で表される x^m の係数が、11回ランダムに選んで年齢を足した和が
m+20*11 になる確率となります。

平均年齢31.0歳未満というのは、11回の和が340以下、
平均年齢34.3歳未満というのは、11回の和が377以下
ということですので、
平均年齢31.0歳未満になる確率は、上述した式の、第121項(x^120)までを
とって、x に 1 を代入したものと一致します。
平均年齢34.3歳未満になる確率は、上述した式の、第158項(x^157)までを
とって、x に 1 を代入したものと一致します。

よって、【厳密解】は、次のようになります。

【 平均年齢31.0歳未満になる確率は、0.000646731 ≒ 0.0647% 】
【 平均年齢34.3歳未満になる確率は、0.0111554 ≒ 0.0112% 】

No.3 の結果は、これに良く一致することが解ります。

2回判決があって、1回が平均年齢31.0歳未満、あと1回が
平均年齢34.3歳未満になる確率は、

2*0.000646731*0.0111554 = 0.0000144291 であって、
そんなことが起こるのは、約10万回に1度の確率と言えます。

繰り返しますが、この仮定は平均値が若くなりやすいように設定されたもので、
実際には、No.5 にありますように、約百万回に一度のことが起こったと
考えるのが普通です。
    • good
    • 0
この回答へのお礼

何度も投稿いただき、大変感謝しております。
ただ、今回のご指摘は私の理解を超えています。猫に小判になってしまって申し訳ない気持ちです。
No3でのお答えを参考に、自分なりにCrystalBallというソフトを使って100万回の試行をやってみました。平均が30.9以下になったのが560ケース、確率で0.056%という結果を得ました。
ありがとうございました。

お礼日時:2010/10/09 13:52

#3さんの示したサイトの東京都のデータから,20歳以上の都民の平均年齢μとその標準偏差σは,μ=49.46歳とσ=18.26歳です。


統計学で重要な定理に,中心極限定理があります。これは,母集団の分布がどうであれ,それから採られた標本の平均の分布は正規分布になり,その平均x'はμに等しく,標本の大きさ(個数)をnとすれば,標準偏差はσ/√(n)になるというものです。
これを,質問に当てはめます。11人を無作為に選ぶことを繰り返して,その平均年齢を記録します。その平均年齢の平均x'が49.46歳になり,標準偏差は18.26/√(11)=5.50の正規分布になるということです。
これは,正規分布で,平均も標準偏差もわかっているので,11人を選んだときの平均年齢範囲の確率を計算できます。ここでは,11人の平均年齢が30.9歳以下になる確率を計算します。
EXCELでNORMDIST(30.9,49.46,5.50,TRUE)=0.000372です。要するに,11人を無作為に選んだとしたとき,その平均年齢が,30.9歳以下になる確率が,0.0372%だということです。平均的には,3000回も選べば1回くらいは30.9歳以下になるかなという感じです。統計なので,10回選んで出るかもしれないし,10万回選んでも出ないかもしれない。まあ,めったに起こりそうもないという確率です。
ただ,これは100歳以上も含めた確率なので,実際は辞退も認められているようですから,もっと確率は高くなるでしょう。
また,20~69歳の都民とすれば,11人選出の平均年齢43.66歳,標準偏差4.19歳で,30.9歳以下の確率0.00116
になります。%でいえば,0.116%で,1000回に1回程度で,これもめったに起こりそうもないですね。
    • good
    • 0
この回答へのお礼

ありがとうございます。
正規分布を仮定するのでなく、実際の人口分布でかつ20歳以下を除いた場合どうなるか、を知りたいと思いました。
ご指摘ありがとうございます。

お礼日時:2010/10/09 13:48

No.9 正誤表


誤)int heikinList[] = new heikinList[70]
正)int heikinList[] = new int[70];
誤)j++
正)i++

見直さなずに投稿すると、酷いですね・・・
    • good
    • 0

>>No.6 さんへ



No.3 です。

ohia15さん、平均を取るところまでは No.7 のコードでよいので、
その平均を取る操作を十万回か百万回繰り返し、
平均を(int)に変換して、int heikinList[] = new heikinList[70] なんかを作って、カウントしてみてください。
具体的には、

int N = 1000000;
for (int i = 0; i < N; j++)
{
heikinList[(int)select11()]++;
}

みたいなことをすれば、頻度表が作れます。
あとは、heikinList の 20番地から、30番地までの和をとれば、
N回試行中、何回平均年齢が31以下が出たかがカウントできます。

最後に、そのカウント数を、全体の試行数N で割ることで、お望みの確率が得られます。
つまり、【N回試行した時、何回平均が31未満になるか】が求まります。

実際、No.7 のコードをほとんどそのまま使って試したところ、No.3 と同じく0.000655が得られました。
    • good
    • 0

回答No.6です。

Javaで作ったプログラムです。もしよかったら試してみてください。

~~ここから~~

import java.util.*;

public class RandomSelect {
static int tokyo[] = {
115498, 130556, 140068, 156982, 169774, 182470, 186548, 188299, 190693, 194795,
202166, 206170, 208547, 212535, 215812, 228202, 236284, 232013, 228570, 222138,
217760, 215019, 219456, 159171, 203656, 188078, 174770, 165283, 157426, 154458,
148806, 146720, 135968, 137330, 140346, 140234, 143118, 153217, 159420, 173212,
200053, 199158, 203277, 139026, 123291, 151727, 162423, 156167, 156798, 143502};
static Random rand = new Random(System.currentTimeMillis());
static int total = 0;

public static void main(String[] args) throws Exception {
total = 0;
for (int i = 0; i < tokyo.length; i++) {
total += tokyo[i];
}
System.out.println("東京都の20~69歳の総人口 = " + total);

double totalAverage = 0.0;
for (int i = 0; i < 100; i++) {
totalAverage += select11();
}
System.out.println("全体の平均 = " + (totalAverage / 100.0));
}

public static double select11() throws Exception {
int selectedMembers[] = new int[11];
int memberTotal = 0;
System.out.print("メンバーの年齢 [");
for (int i = 0; i < selectedMembers.length; i++) {
int index = rand.nextInt(total);
selectedMembers[i] = searchSelectedPerson(index);
memberTotal += selectedMembers[i];
System.out.print(selectedMembers[i] + " ");
}
double average = memberTotal / 11.0;
System.out.println("], 平均年齢 = " + average);
return average;
}

public static int searchSelectedPerson(int index) throws Exception {
int ruiseki = 0;
for (int i = 0; i < tokyo.length; i++) {
ruiseki += tokyo[i];
if (index < ruiseki) {
return i + 20;
}
}
throw new Exception("Error");
}
}
    • good
    • 0
この回答へのお礼

ありがとうございます。
ううん・・・Javaも勉強しないといけないなあ・・・・

お礼日時:2010/10/09 13:44

東京の年齢分布を使って、100回、11名を選出するというプログラムを作ってみました。


試してみたところ、平均年齢31.18歳という組み合わせが出たケースがありました。

メンバーの年齢 [31 41 36 51 51 58 42 28 35 22 46 ], 平均年齢 = 40.09090909090909
メンバーの年齢 [48 68 30 25 55 57 28 32 41 60 40 ], 平均年齢 = 44.0
メンバーの年齢 [62 31 25 23 44 39 43 24 69 29 33 ], 平均年齢 = 38.36363636363637
メンバーの年齢 [48 69 64 37 61 27 27 35 38 59 27 ], 平均年齢 = 44.72727272727273
メンバーの年齢 [28 62 66 34 46 29 51 34 30 35 56 ], 平均年齢 = 42.81818181818182
メンバーの年齢 [35 58 62 39 43 33 44 57 59 51 34 ], 平均年齢 = 46.81818181818182
...
メンバーの年齢 [29 34 37 26 34 26 27 32 31 46 21 ], 平均年齢 = 31.181818181818183
...
全体の平均 = 43.17727272727273

確率・統計学上は、多くの回数、無作為に抽出すれば平均値に近づくということは言えますが、「個々」の選択が平均から離れることが無いとはいえせん。ここでのポイントは「多くの回数」という点です。多くの回数繰り返せば平均に近づきますが、20~69歳という幅に対して、11名しか選出していない場合、個々の選出については偏る可能性もあります。(それが無作為(ランダム)という意味です)

単純なイメージとしては、20~69の目のサイコロを11回振って、その目の平均が45にならなかったといって、問題があると思うかどうかです。100回、1000回と続けて、平均に近づかなかったらおかしいとは言えますが。

平均年齢について、統計学上おかしいと指摘する人がいますが、統計学という学問では、これをおかしいかどうか判定することはできないと思います。
    • good
    • 0
この回答へのお礼

ありがとうございます。
確かに11人の平均年齢がうんと小さくなるケースがあり得ることは間違いないと思います。ただ、その確率がどのくらいか、であって、何百回に1回しか起こらないことなら、その裏に何かあるのではという疑念が湧く、という事かと思います。
実は私もN03の答えを聞いてから、クリスタル・ボールというソフトを使って試行してみました。100万回無作為抽出を行って、平均年齢が30.9歳以下になったのは560ケースありました。確率0.056%です。
これはやはりあり得るけど滅多なことでは起こらない、と考えるのが普通ではないでしょうか。

お礼日時:2010/10/09 13:43

No.3 です。


えっと・・・すごい恥ずかしい間違いしてました。訂正させてください。

>結果から考えると、1回目が1.1%, 2回目が0.065% となると、2回合わせて、0.0072%
>などという、文字通り「万に一つも起こらない」ことが起きてしまっていることになります。

の部分ですが、1.1%, 0.065% 合わせて、【0.00072%】ですから、
【10万回に1回も起こらないことが起きている。】が正解です。

すごく恥ずかしい(涙 
一応、これは、70歳以上が全く参加しないという前提ですので、かなり若い人に傾きやすい設定です。
実際には、本当に高齢の方(90歳以上?)を除いて、全員が断るとは考えにくく、確率はもっと下がります。

真の値に近づくような設定でシミュレートした結果を一応書いておきます。
人口の分布は、No.3 の統計の所からデータをとったもので、かなり正確です。

「東京都の区部・市部から、無作為に11人選ぶ。
 ただし、70歳~79歳の方は、1/3は断る。80歳以上は、必ず断る。」
という条件の元、また1億回試行してみると、

平均年齢 : 46.0歳

【 平均年齢が34.3歳未満になる確率:0.00442832 ≒0.44% 】
【 平均年齢が31.0歳未満になる確率:0.00023758 ≒0.024% 】

1回目:0.44%, 2回目:0.024% 合わせて、1.0*10^-6(百万分の一)
ということが起こったことになります。こちらの方が実際の値に近いはずです。

流石に、これを偶然で済ませるのは、なかなか難しそうです。

何らかの意図をもって、人を選んだとなれば、「どのような基準で選んだのか」が
問題になると思います。

マスコミでは、「ド素人の若い人の判断」ということを前面に出していますが、
もし、仮に、無作為でなく、意図的に検察審査会が11人を選んだとするならば、
これは「ド素人の若い人」の意見ではなく、
正真正銘の「プロ」である検察審査会の選定人の意図が強く反映されたものと考えるのが筋です。

決議をする日程を決めることや、審査員を選ぶこと、短期間膨大な捜査資料を読み解くことなどは、
若い人でなくとも、素人では不可能なのであって、世間の人が、この11人の人たちや若者について
あれこれ言うのは著しく筋違いで、本質から目を逸らしている(目を逸らさせられている)ように感じます。
    • good
    • 0
この回答へのお礼

ありがとうございます。
70歳以上の条件をちょっと変えただけで、劇的に確率が下がるんですね。ちょっと驚きました。
この結果は選定人の意図なのか、選ばれた人達が何人か断り、結果として若い人だけになったのか?サラリーマンだと会社を休むのが大変だから、断れるものなら断りたいのが心情でしょう。学生なら「面白そうだからやってみよう」という人が多いだろうけど。
何人に断られたのかなど選定の過程も出来れば公表して欲しいですよね。

お礼日時:2010/10/09 13:38

No.1です。


選出される人の分布が20才にカットOFFが有り、台形の様な形を
していることから、通常の計算ではできないと考え単に平均だけで
おかしいと示すに留めました。

年齢階層別に箱に入った多数の球を考え、それをランダムに取出し、
平均年齢30才という制限条件下での出現確率を求めるという、
統計物理に似た問題と考えましたが、とても定式化はできませんでした。

No.3の回答に敬服です。パチパチ!!

年輩者ですが、今回の件に限らず疑問に思っていたことが有ります。
裁判員裁判でも、インタビューに答えている60才以上の年輩者が
極めて少ない事に違和感を持っていました。この質問の資料にも
見られるように60才以上の人口はかなり多くまだ元気な人が多いのに
です。
辞退できるのでそうなるのかと思っていました。
裁判員の様に義務では無く、辞退が容易なら今回の件では
次の可能性も考えられます。
ランダム(?)に選ばれた審査員のプールから「そんな事には
関わりたくない、興味はない」と言わせるように依頼を持って行く。
残るのは世論に影響を受けやすい正義感(?)の高い若い人で暇な人。

世論とか世論調査に振る舞わされる作今ですが、こういう重要な点を
検証無しで垂れ流すTV、新聞には警鐘を鳴らしたいものです。

以前「何故どの世論調査も有効回答率は60%程度なの」と言う質問に
「現在の生活では、固定電話で捕まる人の割合はほぼ一定で、それが
60%。忙しく動き回る働き盛りの人は捕まらず、調査結果にはあまり
反映されない事に注意する必要が有ります。」と答えた事が有ります。

質問者と興味有る回答に改めて「教えて!Goo ってい~もんだな~」と
実感しました。
    • good
    • 0
この回答へのお礼

そうですね。民主主義は公平性と透明性の確保が非常に大切だと思いますが、透明性とプライバシーは時として反するのでそこが問題だと思います。
裁判員とか検察審査会の委員とか、個人情報が漏れるのは大いに問題なのでしょうが、せめて性別と年齢くらいは公表してほしいですね。それくらいの透明性がないと、仮に自分が当事者になったとき、やってられないという思いがするでしょう。今の小沢さんがまさにそうでしょうが。

お礼日時:2010/10/08 09:48

http://www.toukei.metro.tokyo.jp/juukiy/2010/jy1 …
ここで、かなり正確な平成22年現在の東京都の年齢別人口が分かります。

http://sankei.jp.msn.com/affairs/trial/101005/tr …
で報じられているように、検察審査会の11人の平均年齢は、
1回目:34.27歳 2回目の平均年齢:30.90歳 となります。

今回の検察審査会の対象は、東京都民ですが、まず有権者から選ばれ、
検査法第5条から第7条に該当する方が除斥され、検査法第8条に該当する方は辞退可能です。
http://www.houko.com/00/01/S23/147.HTM#s2
辞退出来る人の条件は下の大まかにはリンク先の通りで、70歳以上の方は任意に辞退出来ることになります。
http://www.courts.go.jp/kensin/q_a/q28.html
また、島に住んでいる人など、町村に住んでいる人たちは、往復でかなりの負担がかかるため、
やむを得ない事情ということで、抜けることも可能かもしれません。

除斥される方は、まず全体からみて少なく、また、年齢もほぼ一様に広がっていると
考えられるため、考慮する必要はありません。(誤差の範囲になります)

以上の事から、対象を、『平成22年の東京都の区部・市部の20歳以上、70歳未満』に限定して、
計算機を用いてシミュレートしてみました。

114764, 129829, 139317, 156213, 168990, 181678, 185709, 187437, 189819, 193936,
201216, 205167, 207597, 211507, 214705, 226978, 235054, 230807, 227315, 220988,
216615, 213950, 218324, 158336, 202569, 187105, 173772, 164315, 156465, 153510,
147778, 145646, 134967, 136167, 139211, 138967, 141882, 151812, 157961, 171561,
198236, 197308, 201501, 137814, 122194, 150353, 160989, 154820, 155493, 142255,
上のデータは、20歳から69歳までの、条件に該当する人口です。
この人数をそのまま使って、無作為に11人抽出し、その平均を取る操作を1億回行います。

100000000 回(1億回)の試行結果

【 平均年齢が34.3歳未満になる確率:0.01115924 ≒ 1.1% 】
【 平均年齢が31.0歳未満になる確率:0.00064632 ≒ 0.065% 】

平均年齢は、43.6 歳です。(本来は、もっと上がります。)

分布は、添付画像の通りです。
*町村部を含めたり、70歳以上の人が多少なりとも断らないとすれば、もっと確率は下がります。

結果から考えると、1回目が1.1%, 2回目が0.065% となると、2回合わせて、0.0072%
などという、文字通り「万に一つも起こらない」ことが起きてしまっていることになります。

これは、検察審査会の選定人が、意図的に若い人のみを選定をしたことが一目で伺える結果で、
マスコミが「市民感覚」などと、あたかもメンバー11人が国民の代表的感覚であるように
宣言することが、如何にインチキくさいことであるか、わかると思います。

これだけ検察の不祥事が続いている中の出来事ですから、
「検察審査会なるものが、政治闘争に利用されたのではないか」という疑問は誰でも
持つはずで、ここの部分の真相を明らかにしてもらいたいところです。

色々噂はありますが審査申立人が不明で、1回目の顧問弁護士「米澤敏雄」は麻生総合法律事務所勤務
ですが、http://www.aso-law.jp/topics.html をみると、政治的に中立であったか甚だ疑問です。
2回目も僅か1週間で決議を下し、その議決書も被疑事実外のことが書かれている、といった、
かなり危ういことが続いているのは事実で、それを全く報じないマスコミと検察主導の
「魔女狩り」裁判が、法治国家日本で行われようとしていると考えると、背筋が凍る思いです。
    • good
    • 0
この回答へのお礼

ありがとうございます。
そうか!パソコンでシミュレーションしてみる、という手がありましたね!!
ともかく確率はきわめて少なく、何らかの意図があったと見るのが自然だということですね。
小沢さん側はそれをもっと言うべきだと思うのでが、報道されないのは、言ってないのか、言っているけどマスコミがその意見を封じているのか?マスコミの専制を許さないのもインターネットの大きな役割のひとつだと思います。

お礼日時:2010/10/08 09:43

 統計の専門家ではないので誤りがあるかもしれませんが、計算をしてみました。



 参考URLページから東京都の年齢階級別人口の一部を引用すると、

20~24歳  712,878
25~29歳  942,805
30~34歳 1,045,230
35~39歳 1,147,207
40~44歳 1,015,062
45~49歳  840,015
50~54歳  709,170
55~59歳  769,201
60~64歳  864,805
65~69歳  770,617

のようになっています。70歳以上の人口も無視できない規模ありますが、70歳以上は年齢を理由として検察審査員を辞退できるようなので除外(*1)します。

 母集団の平均μと標準偏差σを計算すると、μ=43.7、σ=13.9となります。

 この母集団から大きさ11の標本を無作為抽出する場合、標本平均は近似的に平均m=μ=43.7、標準偏差s=σ/√11=4.2の正規分布に従います(*2)。

 正規分布表から、標本平均が30.9以下(m-3.05s以下)となる標本が抽出される確率は約0.11%と求められます。

 なお、1回目の「起訴相当」を議決した際の平均年齢である34.3歳の場合は、標本平均がそれ以下(m-2.24s以下)となる標本が抽出される確率は約1.25%となります。たった3.4歳違うだけですが、確率的には10倍の起こりやすさの差があります。

*1 これによって母集団の平均、標準偏差はともに小さくなります。
*2 標本の大きさがやや小さいので、近似の精度はあまり高くなりません。

参考URL:http://www.toukei.metro.tokyo.jp/juukiy/2010/jy1 …
    • good
    • 0
この回答へのお礼

ありがとうございます。
平均値から乖離具合と標準偏差の関係から確率を推定するのですね。なるほど!!
それにしても確率が0.1%とは!これは無作為抽出とはいいがたいのではないでしょうか。小沢さんの「実態がベールに包まれている」という指摘も当たっているかも。

お礼日時:2010/10/08 09:33

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

今、見られている記事はコレ!

  • 数学は日常生活に役立っているのか?専門家に聞いてみた

    3月14日は、1997年に財団法人日本数学検定協会が制定した数学の日である。あなたは学生の頃、数学は得意だっただろうか? 筆者のように得意ではなかった人なら、「将来、これが何の役に立つのだろう……」と四苦八苦...

  • この問題解けますか?「1・1・5・8」を使って10を作るパズル

    テンパズルというのをご存知でしょうか。この名前は知らなくともやったことのある方も多いと思いますが、どういうものかと言いますと、4つのひと桁の数字を足したり引いたり掛けたり割ったりして10にする、というも...

  • 数学は実生活で役立つのか

    学校で学んだ事柄が後々の仕事に役立ったなどという話は、よくあるケースですが、学んでいる最中はなかなか気づかないものです。子どもから「数学ってなんの役に立つの?」と聞かれて、数学が苦手だった親はどう答え...

  • 無駄に覚えている数字ってどのくらいあります?

    覚えたくても覚えられない数字がある一方で、なんとはなしに記憶した数字がずっと頭に残っているケースもあります。くっきりと覚えてはいるものの「多分、これ一生使わないんだろうな…」と思っている数字、今日はそ...

  • あなたも挑戦!?バカ田大学入試

    大人気ドラマ「ガリレオ」、観ている方も多いのではないでしょうか。学生時代に数学が苦手で、もう数式なんて見たくない!と思っていても、さらさらと難解な数式を操る湯川先生(福山雅治さん)の姿を見るとかっこい...

おしトピ編集部からのゆる~い質問を出題中

お題をもっとみる

このQ&Aを見た人が検索しているワード


このカテゴリの人気Q&Aランキング

おすすめ情報

カテゴリ