統計の問題で信頼区間を求める際に、
信頼率90%なら1.65、95%なら1.96を標本標準誤差にかけますが、
この数字はどうやって求めるのでしょう?
信頼率が他の値になった場合に解けなくて困っています。

正規分布の表から判ると習いましたが、
最大でも0.5までしか見当たらず悩んでいます。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

正規分布の表を見てみようか.



1.65 のとき, 値はいくつになっていますか? そして, その値はいかなる確率を表しているのですか?
    • good
    • 12
この回答へのお礼

早速のご回答ありがとうございます。

1.65の時の確率は0.4505、左右合せて90%になりました♪

t分布表のようにそのまま1.65とかが出てくる表が別にあるのかと
思い違いをしていました。

本当に助かりました。

お礼日時:2012/10/05 23:58

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q二項分布と正規分布の違い?

を、教えていただけないでしょうか?

よろしくお願いします。

Aベストアンサー

どぞ。
http://ja.wikipedia.org/wiki/%E4%BA%8C%E9%A0%85%E5%88%86%E5%B8%83

正規分布は二項分布の良好な近似値ではありますが、両者は
「二項分布はABどちらかの値を取る全てのデータの分布」であり
「正規分布は多数のデータのうちから任意の数だけ取り出した時
に発生する分布」ですから、データのサンプル方法が違うんです。

逆に言えば、双方のサンプル数が相当に多く、かつ、サンプルの
取りえる値が適切ならば、双方は同じ形状のグラフになります。

数学的に言えば、二項分布が一定の条件下で正規分布に近づく
ことは、中心極限定理の特別な場合に相当する・・・ってことに
なるんですが。

Q統計学 母平均の95(90)%信頼区間の求め方

↓の問題の解き方と回答が分かる方いませんか?
参考書を読んでもチンプンカンプンで非常に困っています。。
宜しくお願いします。

標本A{10・6・12・6・10・10}
標本B{9・3・11・2・5・6}
(1)標本Aの母平均の95%信頼区間
(2)標本Bの母平均の90%信頼区間
*条件:t分布を使って解く

Aベストアンサー

標本Aについて,

平均=9.6,標準偏差=2.19,標本の大きさ=6,自由度=5

手順1.sqrt(標準偏差/自由度)を計算する。
手順2.自由度5,有意水準95%の値をt分布表から読み取る(この場合は2.571)。
手順3.±2.571*(手順1で計算した値)を計算する。
手順4.平均±(手順3で計算した値)を計算する。

手順4で計算した値が質問されている答えになるはずです。標本Bの場合も同様の手順でできますが,有意水準が90%なので値を読み取る際に注意してください。

Q二項分布、ポアソン分布、正規分布の問題

明日は確率のテストです。普段授業を聞いてないので勉強していて簡単な問題で躓いてしまいました。簡単だとは思いますが教えてください。

(1)不良品10%の製品の山から製品4個をでたらめにとる時この中に含まれる不良品の個数を確率変数Xにとる
(a)P(X=2)を求めよ
(b)P(X>=2)を求めよ

(2)ある製品では1%が不良品である。不良品を少なくとも1つ含む確率が95%を越すためには、少なくとも何個の製品を無作為抽出しなければならないか?

(3)確率変数Xが2項分布B(1000,1/2)に従う時、確率P(X>=400)の近似値を求めよ。

できればどういう公式を使って解いているのかも教えてくれたら幸いです。ずうずうしいとは思いますがヨロシクお願いします。

Aベストアンサー

お~おめでとうございます!!
全部できましたか?
もう今日ですが,テスト頑張って下さい!!

Q【確率統計】99%信頼区間に6個中、5個入ること?

Aが、Bと同等であることを示したいです。

A及びBは正規分布を示し、Bはμ=100、σ=1.0という前提です。

Aを5個測定して、Bの99%信頼区間に入れば、BはAと同等であると言いたいのですが、その場合、危険率は5%となります。

測定結果が信頼区間から外れる確率は5%あるので、判定基準を5個中、5個としてしまうと厳しい判定だと思います。
そこで、6個中、5個が99%信頼区間に入ればAはBと同等と結論付けたいと思いますが、これでは判定が緩すぎると言われる不安があります。

測定のn数はこれ以上増やせません。
6個中、5個でOKとすることについて、どのように理論だてれば良いでしょうか?
また、1個は外れ値が出てもOKとすることを前提として、「6個中、5個が99%信頼区間に入る」の代案がありましたら、ご教示お願いいたします。

Aベストアンサー

> Aを5個測定して、Bの99%信頼区間に入れば、BはAと同等であると言いたいのですが、その場合、危険率は5%となります。

99%信頼区間とありますが、母平均の信頼区間ではないですよね。
多分、Bの分布の99%を覆う区間のことを言っているのだと思いますが、それを信頼区間とは呼ばないでしょう。

さて本題ですが、もしAがBと同じ分布であるなら5個のデータがすべてBの99%区間に入る確率は0.99^5=0.95099なので、確かにほぼ有意水準5%の検定になります。
一方6個中5個以上とすると0.99^5*0.01*6+0.99^6=0.99854なので、有意水準0.146%の検定になります。
データ数が異なるので一概には言えませんが、有意水準を小さくとると検出力は悪くなるので、判定が緩すぎると言われる可能性がありますね。
でしたら、99%区間ではなくもう少し狭めて有意水準を5%となるようにしては如何でしょうか?
0.93715^5*(1-0.93715)*6+0.93715^6=0.95000

しかし、この方法ではAとBが同じ分布であるという検定にはなりませんね。
平均と分散が異なっていてもBの99%区間に入いる確率が99%である分布を考えてみてください。

もし、「A及びBは正規分布を示し、Bはμ=100、σ=1.0という前提」が確かならば、Aのデータから標本平均と標本分散を計算し、μ=100、σ=1.0かどうか検定した方が良いように思います。
このとき、個々の検定の有意水準は2.5%とします。
データ数は多い方が良いので5個よりは6個ですべきです。

あと付け加えると、同等性の検定について調べてみることをお勧めします。
簡単に説明すると、統計的仮説検定は同じであるということが基本的にはできません。
そこで、ある程度以上の違いを十分な検出力で検出できるように検定し、その結果有意でなければ、帰無仮説を支持しようというのが同等性の検定です。

> Aを5個測定して、Bの99%信頼区間に入れば、BはAと同等であると言いたいのですが、その場合、危険率は5%となります。

99%信頼区間とありますが、母平均の信頼区間ではないですよね。
多分、Bの分布の99%を覆う区間のことを言っているのだと思いますが、それを信頼区間とは呼ばないでしょう。

さて本題ですが、もしAがBと同じ分布であるなら5個のデータがすべてBの99%区間に入る確率は0.99^5=0.95099なので、確かにほぼ有意水準5%の検定になります。
一方6個中5個以上とすると0.99^5*0.01*6+0.99^6=0.99854な...続きを読む

Q二項分布について

今、授業で二項分布などをやってるのですがいまいちわかりません。
そこで2項分布と正規分布についてそれぞれの特徴を教えてください。
お願いします。

Aベストアンサー

二項分布と正規分布の重要な違いは、一方が離散型確率変数の分布であり、もう一方は連続型である。
また、試行回数を増やすと二項分布はある適当な正規分布に近いので、二項分布をその正規分布で近似できるという関係がある。

Q統計学の授業で区間推定と信頼率というワードが出てきたのですが、どなたか説明してくださる方はいらっしゃいませんか?

統計学の授業で区間推定と信頼率というワードが出てきたのですが、どなたか説明してくださる方はいらっしゃいませんか?

Aベストアンサー

「区間推定」の話の中で、「信頼率」のほかに「信頼区間」というワードも出てきませんでしたか?

「区間推定」とは、母集団の平均値(真の値)を、ある幅を持って推定することです。全数調査でない限り、母集団全体の(真の)平均値なんて分かりませんから、どうしても推定せざるを得ません。「標本から推定すると、母集団の平均値は、この値からこの値までの間に入るのではないか」という推定です。

「信頼区間」とは、母集団(全体)の平均値や分散値などがあると考えられる区間のことです。よく、95%信頼区間、99%信頼区間などといいまして、それは、母集団(全体)の値がこの区間にある確率が95%や99%であることを表しています。言い換えれば「100回サンプリングしたら、95回(99回)はこの範囲内に値が当てはまる(という確率)」といえます。

簡単に言うと、「誤差の範囲」(許容できる誤差)ということです。

例えば、日本のある場所で道行く人の国籍を調査をした結果、回答してくれた1000人のうち100人が外国人だったとして、その割合は「10.0%」なわけですが、これでもって、日本中の外国人の割合は「常に10.0%」である、と結論付けるのは危険です。全数調査ではありませんので、当然誤差が生じます。その範囲(上限と下限)はどうか、というのを数学的に算出するわけです。

算式は次のとおりです。(Excel風に表記します)

・下限値 (外国人数/調査人数)-(1.96*SQRT((外国人数/調査人数)*(1-(外国人数/調査人数))/調査人数))

・上限値 (外国人数/調査人数)+(1.96*SQRT((外国人数/調査人数)*(1-(外国人数/調査人数))/調査人数))

これは、信頼率が95%の場合です。信頼率が99%であれば、「1.96」を「2.58」に変えてください。

以下、厳密性には欠けますが、ダーツに例えますので、イメージしてみてください。

母集団(全体)の平均値(真の値)が「的の中心」で、標本の平均値(調査値)が「矢」だとします。そして、サンプリングを「矢を投げること」、信頼率を「命中率」、回答率を「腕前」とします。

ではこの場合、信頼区間(誤差の範囲)は何に相当するでしょうか?そう、「的の大きさ」です。

さて、矢を投げて、的の中心に当てるのは難しいですが、的そのものに当てるのであれば、その的が一般的な大きさであれば、そんなに難しいことはないですよね。

しかし、的が小さい場合(信頼区間≒許容誤差が小さい場合)、的に当たれば、それは中心(真の値)に近いことを示しますが、命中率(信頼率)は下がります。

この状態で命中率(信頼率)を上げたければ、腕前(回答率)を上げるしかありません。

一方、同じ腕前(回答率)で命中率(信頼率)を上げたければ、的を大きくすれば(信頼区間≒許容誤差を大きく取れば)よいのですが、それだと、的に当たったとしても、中心(真の値)からは遠いかもしれません(近いかもしれませんが、それは分かりません)。(ちなみに、信頼率を95%から99%に上げるとどうなるか…?もうお分かりですね。)

ざっくり言うと、こういう関係になっているのです。イメージできましたでしょうか?

もっとも、実はあんまり正確な例えではないんですよね。というのは、信頼区間(許容誤差)の「場所」がちょっと違うのです。

「場所」とはどういうことかというと、上記のダーツの例では、信頼区間(許容誤差)を「的の大きさ」に例えました。これでは、矢を投げて(サンプリングして)、その矢(調査値)が的に当たるかどうか(信頼区間≒許容誤差の範囲内に納まるかどうか)という話になりますよね。でも、ちょっと違うのです。

本当は、誤差がある場所は「矢」(調査値)の方なのです。矢を中心に信頼区間(許容誤差)が設定され、投げると(サンプリングすると)、その許容誤差が、中心(真の値)を含むかどうか、というのが正しい理解なのです。

例え直すと、ダーツではなく、輪投げのイメージですね。つまり、輪の中心が「調査値」、輪の直径が「信頼区間(許容誤差)」、的棒が「真の値」というわけです。命中率が「信頼率」、腕前が「回答率」であることは変わりません。

いかがでしょうか?単に用語の意味だけだとサッパリ分からなくても、何かに例えてみることで、イメージで理解する方がよいのではないかと思い、思いっきり噛み砕いてみました。回答に厳密性は欠けますが、お役にたてば幸いです。頑張ってください!

「区間推定」の話の中で、「信頼率」のほかに「信頼区間」というワードも出てきませんでしたか?

「区間推定」とは、母集団の平均値(真の値)を、ある幅を持って推定することです。全数調査でない限り、母集団全体の(真の)平均値なんて分かりませんから、どうしても推定せざるを得ません。「標本から推定すると、母集団の平均値は、この値からこの値までの間に入るのではないか」という推定です。

「信頼区間」とは、母集団(全体)の平均値や分散値などがあると考えられる区間のことです。よく、95%信...続きを読む

Q負の二項分布の名前の由来

負の二項分布は、何故「負の二項分布」と呼ばれているのでしょうか。

昔どこかの教科書で、二項分布で何かのパラメータを負に拡張することで得られる、と読んだ覚えがある(うろ覚えですが)のですが、式をいじくってもいまいち分かりません。

よろしくお願いします。

Aベストアンサー

下記でどうぞ
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/neg-nikou.html

Q統計の問題 信頼区間と信頼係数について

統計初心者です。
下記の問題を拝見したのですが、さっぱり分かりませんでした。

ある集団でのイベント発生確率に対する信頼区間の信頼係数を90%から99%に変化させたとする。
他の条件は同じだとして、信頼区間幅に関する記述のうち正しいものはどれか。
次のうちから1つ選べ。
 1 信頼区間幅が57%増加する
 2 信頼区間幅が57%減少する
 3 信頼区間幅が9%増加する
 4 信頼区間幅が9%減少する

「信頼区間幅」というのは統計検定における95%や99%とはまったく別のものと解釈してよろしいでしょうか?
また、解答欄の57%や9%という数字がどこからきたのか全く分かりません。
(1.96や2.57だったらなんとなく分かります)

数式的な理解は難しいので、できるだけ数式を使用しないで教えていただけるとありがたいです。
よろしくお願いします。

Aベストアンサー

統計って、なんか話がややこしいですよね。

 信頼区間の話は、よく出て来る「正規分布」のカーブを思い浮かべると理解できると思います。
 「正規分布」は、平均値をピークに、左右にダラ下がりの分布です。標準偏差を「σ」として、
  平均値± σ の範囲に、全体の 68.3% が入る
  平均値±2σ の範囲に、全体の 95.4% が入る
  平均値±3σ の範囲に、全体の 99.7% が入る
ということになります。
 質問者さんのおっしゃる「1.96」や「2.57」は
  平均値± 1.96σ の範囲に、全体の 95.0% が入る
  平均値± 2.57σ の範囲に、全体の 99.0% が入る
という意味ですね。(σ側ではなく「全体の○○%」の方を基準にした言い方)
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.htm 

 この「σの何倍」で表わされる方が「信頼区間」です。
 全体の何%がその範囲に入るかを表わす方が「信頼係数」です。
 「信頼」と付いているのは、「その範囲に入る」という意味合いだからでしょう。(「その範囲から外れる」場合には「危険率」とか「有意」(=違いに意味がある)と言います)

 たとえば、テストの点数で、「80%の生徒が50~70点の範囲に入る」なら、「信頼係数(=信頼度)80%の、点数の信頼区間は50~70点である」という感じ。

 当然、信頼係数を大きくして「90%の生徒が」とか「99%の生徒が」といえば、「信頼区間」も大きくなります。
 「信頼係数(=信頼度)80%の信頼区間は50~70点である」=50~70点の範囲に生徒の80%が入る
 「信頼係数(=信頼度)90%の信頼区間は40~85点である」=40~80点の範囲に生徒の90%が入る
 「信頼係数(=信頼度)99%の信頼区間は10~98点である」=10~98点の範囲に生徒の99%が入る(ほとんど全員?)
という感じ。

 上の例で分かるように、「信頼係数(=信頼度)」の数値と、「信頼区間」の数値には直接の関係はありません。
 ですから、ご質問の問題も「意味不明」です。定性的に「信頼係数を90%から99%に変化させたのだから、信頼区間幅は増加する」と言えても、これが「57%」か「9%」かは特定できません。そもそも「信頼区間幅の%って何?」という定義も必要ですし。
 無理やりこじつけると、上の正規分布の例の延長で、正規分布表を調べてみると、
  平均値± 1.64σ の範囲に、全体の 90% が入る
  平均値± 2.57σ の範囲に、全体の 99% が入る
ということで、信頼区間の比をとると 2.57σ/1.64σ ≒ 1.57 、つまり「1」が正解ということかもしれません。でも、それは「正規分布」などの「前提条件」を付け、かつ「正規分布表」などの数値データを提示しないと判定できません。

 質問者さんの疑問は当然のものと思います。お示しの問題は「悪問」もしくは「特別の前提条件が提示された上での問題」なのではないかと思います。

統計って、なんか話がややこしいですよね。

 信頼区間の話は、よく出て来る「正規分布」のカーブを思い浮かべると理解できると思います。
 「正規分布」は、平均値をピークに、左右にダラ下がりの分布です。標準偏差を「σ」として、
  平均値± σ の範囲に、全体の 68.3% が入る
  平均値±2σ の範囲に、全体の 95.4% が入る
  平均値±3σ の範囲に、全体の 99.7% が入る
ということになります。
 質問者さんのおっしゃる「1.96」や「2.57」は
  平均値± 1.96σ の範囲に、全体の 95.0% が入る
  平...続きを読む

Q負の二項分布の積率母関数

負の二項分布の積率母関数がわかりません(><;)
二項分布の積率母関数だとM(t)=(pe^t+(1-p))^m と表せますよね??こんな風に負の二項分布の積率母関数も表せないでしょうか??
独立な確率変数X、Yに関して、再生性を証明したいのですが・・・
どなたかよろしくお願いします!!m(_ _)m

Aベストアンサー

独立同一の幾何分布にしたがう確率変数の和の確率分布が負の二項分布でした。だから再生性はほとんど自明ですが、せっかくだから。。。

幾何分布の確率関数f(x)=p(1-p)^(x-1) (x≧1)
積率母関数M(t)=E[e^(xt)]
=Σp(1-p)^(x-1)*e^(xt)
=Σ(pe^t)*((1-p)e^t)^(x-1)
=(pe^t)/(1-(1-p)e^t)

よって、負の二項分布(n,p)の積率母関数は
E[e^(xt)]={(pe^t)/(1-(1-p)e^t)}^n

ついでに、この式から確率関数が求められて、
M(t)={(pe^t)/(1-(1-p)e^t)}^n
=p^n*e^nt*Σ(-1)^k*C[-n,k]*(1-p)^k*e^kt  (k=0,1,2,...)
=Σ(-1)^k*C[-n,k]*p^n*(1-p)^k*e^((n+k)t)  (C[-n,k]は一般の二項係数)
=Σ(-1)^(x-n)*C[-n,x-n]*p^n*(1-p)^(x-n)*e^(xt)  (x=n+k)
∴f(x)=Σ(-1)^(x-n)*C[-n,x-n]*p^n*(-1+p)^(x-n)  (x=n,n+1,n+2,...)
となる。二項係数を
C[-n,x-n]=(-n)(-n-1)…(-x+1)/(x-n)!
=(-1)^(x-n)*C[x-1,n-1]
と変形すると、見慣れた式になる。
f(x)=ΣC[x-1,n-1]*p^n*(1-p)^(x-n)  (x=n,n+1,n+2,...)

独立同一の幾何分布にしたがう確率変数の和の確率分布が負の二項分布でした。だから再生性はほとんど自明ですが、せっかくだから。。。

幾何分布の確率関数f(x)=p(1-p)^(x-1) (x≧1)
積率母関数M(t)=E[e^(xt)]
=Σp(1-p)^(x-1)*e^(xt)
=Σ(pe^t)*((1-p)e^t)^(x-1)
=(pe^t)/(1-(1-p)e^t)

よって、負の二項分布(n,p)の積率母関数は
E[e^(xt)]={(pe^t)/(1-(1-p)e^t)}^n

ついでに、この式から確率関数が求められて、
M(t)={(pe^t)/(1-(1-p)e^t)}^n
=p^n*e^nt*Σ(-1)^k*C[-n,k]*(1-p)^k*e^kt  (k=0,1,2...続きを読む

Q統計学的に信頼のあ有効率は、全体の何%あればよいか

こんにちは。

表題の件ですが、自分が知りたいのは
例えば、100人に「ゲームのマリオが好きかどうか」のアンケートを取り
その中の有る一定の割合(例えば30%とか)でサンプルデータとして無作為に抜き出して
その結果を全体の結果として結論付けたい場合
一定の信用度がある状態というのは、抜き出す割合が何%程度あれば
満たせるのでしょうか。

上記の例ですと、例えばデータの信頼度を80%とするには
抜き出すデータを30%が必要、など。

もちろん、アンケートの対象者によって
ゲームについての質問の場合、
・小学生男子に聞いたケース
・お年寄りも含めて聞いたケース
では、意味も信頼度も変わってくるでしょうが、
「一般的に」という意味で構いませんので、
全体の何割があると信頼がおけるのか、というのを知りたいと思います。

もしお教えいただけるのであれば
できればその事例の根拠や事例など、併せて教えてもらえると助かります。

よろしくお願いいたします。

Aベストアンサー

「一般的に」という意味で語るのは、
小学生男子に聞いたケースでも、お年寄りも含めて聞いたケースでも、
他のどんなケースでも、全ての場合で共通に成立つようにしなければ
一般性があるとは言えませんから、少しハードルが高いかもしれません。


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング

おすすめ情報