同じ名前の二人が偶然一緒に隣に座ったことから始まった、二人のNANAの友情。
この出会いって、確率にすると、どのくらいになるのでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (2件)

いちばん多い名字は「佐藤」さん(全国世帯調査による)


いちばん多い名前は、いちばん人口が増えた年の名前だと考えると昭和24年頃の「博」さん(某保険会社発表)

なので日本でいちばん多い名前は「佐藤博」さんということかな。

統計学的に充分確かな結果を得るには、5000件程度のサンプリング数(但し男性しか考慮していません)があれば充分確かな結果と言えますので、電話帳でも街頭アンケートでもなんでも良いので、5000人を手当たり次第選択して、「佐藤博」さんに当たる件数を数えれば、結果が分かります。

あなたが大学生であれば、5000人のサンプルとして学生名簿を調べるのがいちばん簡単な方法です。10人見つかれば 10/5000=0.002(0.2%)などとなります。
    • good
    • 0
この回答へのお礼

 お礼が遅くなってすみません。
今回は、確率が何%かの答えが知りたかったのです。(申し訳ありませんが、ポイント控えさせてもらいます)
しかし、確かな結果に必要は、5000件だなんて。
調べるのにも大変なんですね。
ありがとうございました。

お礼日時:2007/04/28 18:41

自分がNANAという名前だとして、



全国のNANAさんの人数の統計を取って、そこから1(自分)を引いて・・・
・・・しかし、日本に数名しかいないような珍名でない限り、1を引こうが引くまいが変わらないので、1を引く必要はなさそうなので、

確率 = 全国のNANAさんの人数 ÷ 総人口

が確率になります。

これは、当然、名前によって変わります。

では、
全部の種類の名前についての確率の平均値がどうなるか?について。

まず、名前が全国で何種類あるかの統計を取ります。
すると、ある名前について、同じ名前同士の人の人数の平均値は、

ある名前の人数の平均値 = 総人口 ÷ 名前の種類数

これを上記の式に当てはめれば、

確率(の平均値) = ある名前の人数の平均値 ÷ 総人口
  = 1 ÷ 名前の種類数
    • good
    • 0
この回答へのお礼

 お礼が遅くなってすみません。
申し訳ありませんが、今回は、確率がいくつかの答えを知りたかったのです。
しかし、計算はこうするということ初めて知りました。
ありがとうございました。

お礼日時:2007/04/28 18:38

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q二人の子供の家庭で、二人とも女の子の確率

数学の確率でよくある例です。

 男女の生まれる確率が1/2とした場合は、

 「兄-弟」、「兄-妹」、「姉-弟」、「姉-妹」である確率は1/4
 よって、二人とも女の子(姉-妹)は、1/4になる。

とありますが、

これは、一人目の性別により、二人目を作る・作らないの選択の割合が変わらない
場合と、考えればいいのでしょうか。

Aベストアンサー

>これは、一人目の性別により、二人目を作る・作らないの選択の割合が変わらない場合と、考えればいいのでしょうか。

そうですね。

もし変わるとしたら、数学の問題である以上、一人目が男なら二人目を作る確率はいくらで、一人目が女なら二人目を作る確率はいくら、という条件がつかなければなりませんね。

Q偶然が起きる確率について

 数学の問題かどうか分かりませんが、日常生活で偶然が起きる確率について相談させてください。
というのも、よく起こるのが仕事中にほんの数分(5分くらい)大切な話を同僚と話ている間に、必ずといっていいほどどちらかに来客があったり電話がかかってきたりします。普段はそんなに頻繁に客が来たり電話がかかってくる仕事でもないのですが、ほんとに不思議なくらい大切な話をしている時に限って邪魔が入ります。8時間勤務なので時間に直すと480分。そのうちに1日あたり10件の電話(来客)があるとしても平均48分に1回しか電話(来客)がないことになります。それまで誰も来ずに静かな事務室なのに、重要な話を始めた途端に必ずこの少ない確率が的中して邪魔が入るのはどんなからくりなのでしょう。もちろん来客や電話はこちらの状態はまったく知りません。(意図的に来るわけではありません)。
 
 他にも、普段あまり人気のない道路の角を曲がろうとするとちょうど同じタイミングで反対側から別の人が曲がろうとし、出会いがしらにぶつかりそうになることもしょっちゅうです。ぶつかりそうなタイミングとはホントにほぼ同じタイミングで同じ角を曲がろうとしていたことであり、1日24時間は1440分であり86400秒ですが、この86400秒分の1が頻繁に起きるとはどういうことでしょう。相手もその都度違う人なので、生活リズムや行動パターン(その道を曲がる時間帯)が同じわけでもありません。
 
 こうした生活上の偶然を数学的に説明できるでしょうか。たんなる偶然といってしまえばそれまでですが、何か説明できる理論や考え方があれば教えてください。よろしくお願いします。
 
 (補足ですが、先週の日曜日に娘の運動会に行ったところ、昔大阪で知り合った女性に25年ぶりに東京で再会しました。偶然にもお互いの娘が同じ中学校に通っており、クラスも一緒でした。日本には星の数ほど中学校はあると思いますが、全く同じ学校で同じ学年で同じクラスだったというのもすごい確率だと思います。どういうわけか私にはこんな偶然が頻繁に起こります。ついでに書くと、その娘が生まれた日と私の実父が亡くなったのも同じ日です。親を亡くした日と子供が生まれた日が同じというのも天文学的な確率だと思います。)

 数学の問題かどうか分かりませんが、日常生活で偶然が起きる確率について相談させてください。
というのも、よく起こるのが仕事中にほんの数分(5分くらい)大切な話を同僚と話ている間に、必ずといっていいほどどちらかに来客があったり電話がかかってきたりします。普段はそんなに頻繁に客が来たり電話がかかってくる仕事でもないのですが、ほんとに不思議なくらい大切な話をしている時に限って邪魔が入ります。8時間勤務なので時間に直すと480分。そのうちに1日あたり10件の電話(来客)があるとしても...続きを読む

Aベストアンサー

単に、「電話がかかってきた」という印象が強く残るのが、「大事な話をしていた時」ということではないですか?

一度、「大事な話をしていなかったときに、電話や来客があった」という事象に注意を払って、回数を数えてみてください。

曲がり角の例でも、「ぶつかりそうになることなく、やりすごしている場合」の方が遥かに多いのではありませんか?

「ビギナーズラック」といいますが、あれは初心者がいきなり勝ちを収めたことが、強烈な記憶として残るからでしょう。実際に初心者が勝利するのはそれほど多くないか或いは数学的な確率の理論値に落ち着くはずです。初心者が陥りがちな負け方をしても記憶に残りません。

Q選ばれる確率が偶然以上かどうかの質問

統計はシロートなので、教えていただけたらと思います!

選択肢が50個あり、30人の被験者にこれら50個の中から一つを選んでもらったところ、以下のような結果が出ました。

A:10回
B:7回
C:4回
D:4回
E:2回
F:1回
G:1回
H:1回

I以降残りの42個は1度も選ばれませんでした。

おそらくABCDは明らかに、1/50の確率ではなく、好き好んで選ばれていると思います。
しかし、EFGHは、1回か2回しか選ばれていません。

これらEFGHは、残りの選ばれなかった42個よりも、有意に選ばれる確率が高いのか、それとも今回は偶然選ばれただけで、今後31人、40人と被験者を増やしたら、残りの42個と変わりはないのか、
ということを知る方法はあるのでしょうか?

もしあれば教えていただけたらと思います。無ければあきらめます。

ちなみに、SPSSがあるので、SPSSで調べる方法があるのなら最高です。

Aベストアンサー

企業で統計を推進する立場の者です。

「適合度の検定」には違いないが、
頻度0があるので、たぶんできません。
エラーになるか、SPSSのような高級ソフトであれば、
自動的に「フィッシャーの正確確率検定」に切り替えてくれるかも。

それでも無理かもしれません。
なぜなら、50項目に対して、30回しか試行していないから。
いい加減なソフトなら、確率値を入れてダマせるけど、
治験に使えるようなSPSSは、許してくれないかもしれません。

ところで、今後サンプルを増やしたときの問題というのは、
古典統計では、あまり考えていないことです。
古典統計では、現在の観測結果の平均や分散が、
最尤推定値として、そのまま母集団の点推定値になっているのです。
現時点で観測0ならば、今後もその確率で出ると考えますので、
I以降は、出ないという予想になります。

ところが、今回は30回しか試行していないから、
もしかすると、まだ選ばれていない項目があるかもしれません。
つまり、現時点で観測0でも、出る可能性はあるのです。
この問題は、ベイズ的な議論になります。

この問題は50項の多項離散確率であって、
ノンパラメトリック・ベイズという
難しい方法を使わなければなりません。

ということで、興味があったので、OpenBUGSで
やってみましたが、案の定エラーになりました。
50項目に対し、30回の試行では、情報が少なすぎますね。

[参考]OpenBUGSのスクリプト

model {
phi[1:V] ~ ddirich(theta[])
for (n in 1:N) {
w[n] ~ dcat(phi[])
}
for (v in 1:V) {
theta[v] <- 1/50 #全ての目が同等
}
}
list(V=50,N=30)
list(w=c(10,7,4,4,2,1,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0))

企業で統計を推進する立場の者です。

「適合度の検定」には違いないが、
頻度0があるので、たぶんできません。
エラーになるか、SPSSのような高級ソフトであれば、
自動的に「フィッシャーの正確確率検定」に切り替えてくれるかも。

それでも無理かもしれません。
なぜなら、50項目に対して、30回しか試行していないから。
いい加減なソフトなら、確率値を入れてダマせるけど、
治験に使えるようなSPSSは、許してくれないかもしれません。

ところで、今後サンプルを増やしたときの問題というのは、
古典統計で...続きを読む

Q統計的に、ある音が、ある文字で書かれる確率が、偶然以上かどうかをエクセルで調べる方法はありますか?

28個の単語リストがあります。
全ての単語に、「アー」という音が1回以上出て来ます。
具体的には、2単語だけ2回「アー」が出て来て、残りの26個の単語は1回だけ。
(これが重要かどうかはわかりませんが、念のため)

計30個の「アー」は、8通りの文字で書かれます。(ここでは簡単にA~Hを使います)
頻度は以下の通りです。

A:10回
B:7回
C:4回
D:4回
E:2回
F:1回
G:1回
H:1回

おそらく、A, B, C, Dの4つは、この単語リスト以外の単語や、新しい単語が作られた時にも、「アー」という音を表すために、積極的に使われるんじゃないかと思います。

逆に、E, F, G, Hに関しては、
例えば「はっとり」という音を「服部」と書くような(「発鳥」とか「初取」とかではなく笑)、例外的な書き方というか、
その単語に関してだけたまたま使われてるだけで、生産性はない、「アー」という音を積極的に表すためには用いられないんじゃないかな、と僕はふんでいるのです。

これを、統計的に説明する方法はあるでしょうか?
A〜Dはp<0.05で、E~Hはp>0.05になるとか、そういう類いの方法で。
つまり、A~Dの文字が使われるのは、偶然以上の確率だと示せる方法。

いえ、なければあきらめます。


余談ですが、手持ちの単語リストには、424語ありますが、「アー」という音が出てくるのが28語だけなのです。(重要な情報かどうかわかりませんが念のため。)

28個の単語リストがあります。
全ての単語に、「アー」という音が1回以上出て来ます。
具体的には、2単語だけ2回「アー」が出て来て、残りの26個の単語は1回だけ。
(これが重要かどうかはわかりませんが、念のため)

計30個の「アー」は、8通りの文字で書かれます。(ここでは簡単にA~Hを使います)
頻度は以下の通りです。

A:10回
B:7回
C:4回
D:4回
E:2回
F:1回
G:1回
H:1回

おそらく、A, B, C, Dの4つは、この単語リスト以外の単語や、新しい単語が作ら...続きを読む

Aベストアンサー

ANo.4へのコメントについてです。

「k種類ある互いに排他的な事象のうち、事象E[i]が確率p[i] (i=1〜k)でランダムに生じる(ただしp[1]+…+p[k]=1)」という帰無仮説に対して、サンプル数Nのうち現象E[i]の頻度がr[i] (i=1〜k)という実験結果を得た。という話の場合を流用しようってことですね。
 しつこいけれども、これはあくまでも「辞書に現れる事例の数を、背後にある確率的法則から生じた結果としての「頻度」だ、と捉えることに首肯してもらえるなら」という条件付きの話です。なにしろ、本来あるべき「無尽の母集団からランダムに取ったサンプルが有限個ある」という状況とは全然違う。もしstomachmanが査読者ならクレームを付けるだろうな。ってのはひとまず置くとして。

  H[i]:「事象E[i]が確率p[i]で、E[i]以外が確率(1-p[i])で、ランダムに生じる」
という帰無仮説を考えます。すると、N回中E[i]が丁度r[i]回現れる確率は二項分布
  P(N,r[i],p[i]) =(N!/(r[i]! (N-r[i])!)) (p[i]^r[i]) ((1-p[i])^(N-r[i]))
に従う。もちろん、E[i](i=1〜k)がどれも等確率なら、p[i]=1/kであり、
  P(N,r[i],1/k) = (N!/(r[i]! (N-r[i])!)) (((k-1)/k)^(N-r)) (k^(-r))
ですね。なお、(N!/(r! (N-r)!)) は、Excelでは関数"combin(N, r)"で計算します。
 (もしNが充分大きければ、
  P(N,r,p) ≒ exp(-((r-Np)^2)/(2Np(1-p))) / (√(2πNp(1-p))
つまり正規分布で近似できるのだけれども、この場合にはNが比較的小さいんで、直に計算してしまう方が言い訳が少なくて済みそうだ。)

 さて、E[i]がr[i]回以上起こる確率は
  S[i] = Σ{h=r[i]〜N} P(N,h,p[i])
である。E[i]がr[i]回以下起こる確率は
  T[i] = Σ{h=0〜r[i]} P(N,h,p[i]) = 1-S[i] + P(N,r[i],p[i])
である。どちらか小さい方
  Q[i] = min(S[i], T[i])
が有意水準未満であれば、帰無仮説H[i]は棄却できる、ってことです。

 ただし、DEFGH(あるいは55種類)全部について検定を繰り返すことは、統計学で言う「多重検定」をやっていることになり、有意な結果がちょっとだけ出やすくなる、というバイアスが発生するので、厳密に言えばこれを補正しなくてはいけない。ま、実用上は、判定を誤る確率が有意水準を少々越えるとしても、その有意水準を予め厳しめに設定しておけば実際には問題にはならない。そういう手抜きがしばしば行われますけれども、論文にするんなら、もうちっときっちりやっておきたいな。
 で、「k回行う検定のうちどれか一つでも、「偶然の偏り」のせいで本来棄却できない帰無仮説H[i]を誤って棄却してしまう確率」Rが有意水準未満なら文句はないでしょ、と考える。すると、「棄却できると判定した帰無仮説の番号の集合」をJとして、棄却すべきでない帰無仮説H[i]をひとつでも誤って棄却してしまう」ということが発生する確率Rは
  R ≒ 1-Π{i∈J} (1-Q[i])
であり、Rが有意水準未満であれば文句なかろう。
 (でもこれだと、Rが有意水準を越えたら実験全体を捨てることになっちゃうな。いやいや、もう少し厳密な議論に基づくスマートな補正の考え方が確かあった筈なんですが、その資料がですね、半径2m以内にあることは分かっているんです。ただ、その空間にはざっと見て2000は下らない本やノートが乱雑に積み上げられているというのが問題でして、miningにしばらく掛かりそうです。)

 ところで、有意水準をどう設定すべきか。これが大問題です。
 背後にある確率的法則から生じた結果としての「頻度」を見ているのなら、言い換えれば、無尽の母集団からランダムにサンプルを取ったのであれば、「何度でもサンプルを取り直して実験を繰り返せる。それら多数の、互いに独立な実験のうちのどれだけが「偶然の偏り」によって誤った結論を導くか」が「有意水準」の本来の意味です。しかし、ご質問の場合は互いに独立な実験を繰り返すことはできないから、明らかにこの文脈には乗らない。もしstomachmanが査読者ならクレームを付けるだろうな、ってのはここんとこです。

 Excelでどういう表を作るか、というところまで説明するのは幾ら何でもメンドクサイす。

ANo.4へのコメントについてです。

「k種類ある互いに排他的な事象のうち、事象E[i]が確率p[i] (i=1〜k)でランダムに生じる(ただしp[1]+…+p[k]=1)」という帰無仮説に対して、サンプル数Nのうち現象E[i]の頻度がr[i] (i=1〜k)という実験結果を得た。という話の場合を流用しようってことですね。
 しつこいけれども、これはあくまでも「辞書に現れる事例の数を、背後にある確率的法則から生じた結果としての「頻度」だ、と捉えることに首肯してもらえるなら」という条件付きの話です。なにしろ、本来あるべき「無...続きを読む

Q偶然大阪で偶然同じ服で出会える確率

私は大阪に住んでいて
好きな人は、私とは別で大阪に旅行に来ていて、
偶然新大阪の駅で同じ服で会える確率。

お互いの居場所をお互いは知りません
偶然ばったり会えた時偶然おそろいの服だった。
とゆう確率はどうなりますか?

Aベストアンサー

データがないうえに、新大阪駅行ったことないので仮定で。
①一日に一回新大阪駅を私が利用して
②好きな人が1年に一回大阪に旅行に来て必ず新大阪駅を利用する。
③時間は一時間区切りで考えて8時~22時で限定
④今はインターネットでも服は買えますから、100着に1着は同じ服を持っているとしたら

同じ日に同じ服を着る確率が④から(1/100)×(1/100)=1/10000
同じ日に駅を利用する確率が①と②から(1/1)×(1/365)=1/365
同じ時間に会う確率が③から(1/12)×(1/12)=1/144
すべて掛け合わせると1/525600000

%になおすと、0.0000001903%
になりました。


専門家がやれば全然違うでしょうけどね。


人気Q&Aランキング

おすすめ情報