電子書籍の厳選無料作品が豊富!

二項分布B(n,p)の中央値(メディアン)はなんですか?

A 回答 (3件)

二項分布の中央値は単純には表せないようです。



それで、ドイツ語Wikiが解り易かったのでその抜粋を紹介します。
(訳は拙訳)
https://de.wikipedia.org/wiki/Binomialverteilung …


Median

二項分布の中央値の一般的な公式を与える事は不可能である。
したがって、適切な中央値を与える各種の場合を考える必要がある。

* npが自然数の場合は、期待値、中央値そして最頻値は一致し
  同じ値npとなる。

* 中央値mは区間[np]≦m≦【np】の間に有る。
  ここで、[・]は切り下げ、【・】は切り上げを表す。

* 中央値mは期待値よりそれ程大きくは外れない。
  |m-np|≦min{ln2,max{p,1-p}}

* p≦1-ln2またはp≧ln2または|m-np|≦min{p,1-p}
 (p=1/2で偶数の場合以外)の場合は、中央値は一意的で
  round(np)と一致する。

* p=1/2でnが偶数でない場合は、区間(n-1)/2≦m≦(n+1)/2内の
  何れの数mもpとnをパラメータとする二項分布の中央値である。
  pが1/2でnが偶数ならば、m=n/2が明らかに中央値である。

これらの何れかの分類と定義により中央値なるものを求める事は
できるようです。
私も最初はm=n/2 ???と考えました。
    • good
    • 0
この回答へのお礼

ありがとうございます。理解が深まりました。

お礼日時:2021/11/20 12:43

一般に、中央値は累積分布関数を1/2と置いて解けばよいですが、二項分布の累積分布関数はWikiで見ても分かるように、床関数とか使われていて、解ける代物ではないと思います。



それは、離散分布である二項分布の累積分布のグラフを考えればわかるように、横軸xに対して、縦軸zが鉛直になって階段状に登るグラフとなり、滑らかなグラフにはならないからです。

ところで、二項分布は離散分布ですが、それを連続分布に近似するときは(第1種)ベータ分布が使われます。その中央値はWikiに出ています。

https://ja.wikipedia.org/wiki/%E3%83%99%E3%83%BC …

ベータ分布は、二項分布の連続修正点という点を近似的に通ります。連続修正点は累積分布の階段のステップの中点のことです。

もし、実務で必要であれば、後者(上記Wiki)で計算して、小数点以下の値も出てしまいますから、安全側に丸めて使用すれば良いのではないでしょうか。
    • good
    • 0
この回答へのお礼

ありがとうございます。参考になりました。

お礼日時:2021/11/20 12:41

平均値は np。



最頻値は [(n + 1)p]。
ただし、[(n + 1)p] は (n + 1)p を超えない整数で、(n + 1)p が整数なら (n + 1)p - 1 も最頻値となります。

平均値、中央値、最頻値の関係から、中央値は、平均値と最頻値の間にあると考えられます。
    • good
    • 0
この回答へのお礼

ありがとうございます。
二項分布ではn,pを用いて中央値を表すことはできないのでしょうか?

お礼日時:2021/11/20 10:42

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!