統計の問題で信頼区間を求める際に、
信頼率90%なら1.65、95%なら1.96を標本標準誤差にかけますが、
この数字はどうやって求めるのでしょう?
信頼率が他の値になった場合に解けなくて困っています。

正規分布の表から判ると習いましたが、
最大でも0.5までしか見当たらず悩んでいます。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

正規分布の表を見てみようか.



1.65 のとき, 値はいくつになっていますか? そして, その値はいかなる確率を表しているのですか?
    • good
    • 10
この回答へのお礼

早速のご回答ありがとうございます。

1.65の時の確率は0.4505、左右合せて90%になりました♪

t分布表のようにそのまま1.65とかが出てくる表が別にあるのかと
思い違いをしていました。

本当に助かりました。

お礼日時:2012/10/05 23:58

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q調査結果は、標準誤差率が何%までなら信頼できるデータといえるのでしょうか

統計に関して全くの素人なもので、お力をお貸しいただけると大変助かります。
現在、仕事でレポートを作成しており、政府統計調査のデータを根拠として示したいのですが、標本調査結果に添付されている「推定値の大きさ別標準誤差率」を見ると、同じ調査でもデータの大きさによって1%未満から30%以上の標本誤差率が存在します。
レポートをまとめる際、例えば同じ「業種別の工場数」の表を記載する場合でも、都道府県ごとなら結果精度が保てても、市区町村ごとでは誤差率が大きくなるため不適切、といったことに注意しなければならないと思うのですが、
一般的に、標準誤差率が何%までなら「信頼できる推定値」といえるのでしょうか(あるいは定義があるのでしょうか)。
ご教示よろしくお願い申し上げます。

Aベストアンサー

こんにちは。
補足をありがとうございました。

>>>>>
そもそもの疑問が、標準誤差率5%のA県の推定値と30%のB町の推定値から、「A県全体では○○業の工場の割合が35%だが、B町では60%で、25ポイント上回っている」などと結論づけてよいのだろうか?ということでした。
標準誤差率1%の全国結果とA県となら同じように比較してもある程度実態(母集団の平均値?)を反映した結果になると思うのですが、ただの感覚的なものなので、標準誤差率○%以下なら・・みたいな目安はあるのだろうか?と思った次第です。


なるほど。ご質問の趣旨がわかってきました。

それは、「有意差検定」と言います。
「有意差」というのは、文字通り、意味のある差という意味です。
2者(A,B)を比較して、
「AとBは、危険率○○%で、有意差がある。」
というような言い方をします。
「危険率」というのは、有意差検定の結論が間違いである確率のことです。
(注意!: 当然ながら危険率は、標準誤差のことではありません。勿論、標準誤差に関係はありますけれども。)


検定を行うに当たっては、どれだけの危険率を設定するかは、検定を行う人の自由です。
危険率を小さく設定すればするほど、信頼の置ける「厳しい検定」となり、その代わり、有意差なしという結論が出やすくなります。
どれだけの危険率で検定を行うかを最初に「決心」した上で、検定を行います。

http://www.blufi.co.jp/archives/24344389.html
http://www.shiga-med.ac.jp/~koyama/stat/test.html


ここから先は詳しくない(というか、昔やりましたが、ここ10年以上やったことがない)ので、この辺で筆を置かせていただきたいと思います。

こんにちは。
補足をありがとうございました。

>>>>>
そもそもの疑問が、標準誤差率5%のA県の推定値と30%のB町の推定値から、「A県全体では○○業の工場の割合が35%だが、B町では60%で、25ポイント上回っている」などと結論づけてよいのだろうか?ということでした。
標準誤差率1%の全国結果とA県となら同じように比較してもある程度実態(母集団の平均値?)を反映した結果になると思うのですが、ただの感覚的なものなので、標準誤差率○%以下なら・・みたいな目安はあるのだろうか?と思...続きを読む

Q統計学 母平均の95(90)%信頼区間の求め方

↓の問題の解き方と回答が分かる方いませんか?
参考書を読んでもチンプンカンプンで非常に困っています。。
宜しくお願いします。

標本A{10・6・12・6・10・10}
標本B{9・3・11・2・5・6}
(1)標本Aの母平均の95%信頼区間
(2)標本Bの母平均の90%信頼区間
*条件:t分布を使って解く

Aベストアンサー

標本Aについて,

平均=9.6,標準偏差=2.19,標本の大きさ=6,自由度=5

手順1.sqrt(標準偏差/自由度)を計算する。
手順2.自由度5,有意水準95%の値をt分布表から読み取る(この場合は2.571)。
手順3.±2.571*(手順1で計算した値)を計算する。
手順4.平均±(手順3で計算した値)を計算する。

手順4で計算した値が質問されている答えになるはずです。標本Bの場合も同様の手順でできますが,有意水準が90%なので値を読み取る際に注意してください。

Qべき乗関数の回帰式の95%信頼区間

モデル式としてべき乗関数[Y=a*X^b]を用いて回帰分析を行なっています。回帰式の95%信頼区間を求めたいのですが、計算できません。ご教授願えますか?

これまでやったことを示します。線形回帰の95%信頼区間の計算をRを使って行なうことができるので、べき乗関数を対数変換し、直線回帰を行ないました。ここで得られた95%信頼区間を表す式の切片、傾きから実数空間に戻して再計算したのですが、正しい結果が得られませんでした。

使用しているサンプルは下記の通りです。

X     Y
0.844  2.041873793
0.83  5.242322324
0.743  3.123938274
0.69  1.288763738
0.62  4.60944809
0.42  0.178478931
0.313  0.743454646
0.304  0.87
0.27  0.857248415
0.086  0.171183408

よろしくお願い致します。

Aベストアンサー

せめて、
0.844,2.041873793
のように、コンマ付きで入力してください。コピペで入力するのが大変になります。
で、とりあえず、べき乗回帰はできました。

a<-rbind(
c(0.844 ,2.041873793),
c(0.83 ,5.242322324),
c(0.743 ,3.123938274),
c(0.69 ,1.288763738),
c(0.62 ,4.60944809),
c(0.42 ,0.178478931),
c(0.313 ,0.743454646),
c(0.304 ,0.87),
c(0.27 ,0.857248415),
c(0.086 ,0.171183408)
)
b<-log(a)
res<-lm(b[,2]~b[,1])
summary(res)
exp(res$coef[1]+b[,1]*res$coef[2])
a[,2]

とやってみました。
> res$coef
(Intercept) b[, 1]
1.229917 1.306564

> summary(res)

Call:
lm(formula = b[, 2] ~ b[, 1])

Residuals:
Min 1Q Median 3Q Max
-1.8198 -0.2230 0.1986 0.3194 0.9228

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.2299 0.4097 3.002 0.01701 *
b[, 1] 1.3066 0.3776 3.460 0.00856 **
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 0.8074 on 8 degrees of freedom
Multiple R-Squared: 0.5995, Adjusted R-squared: 0.5494
F-statistic: 11.97 on 1 and 8 DF, p-value: 0.008564

> exp(res$coef[1]+b[,1]*res$coef[2])
[1] 2.7409922 2.6817387 2.3205168 2.1066486 1.8318610 1.1012783 0.7499673 0.7219169 0.6182816 0.1386755
> a[,2]
[1] 2.0418738 5.2423223 3.1239383 1.2887637 4.6094481 0.1784789 0.7434546 0.8700000 0.8572484 0.1711834


95%信頼区間は・・・どうやるんでしたっけ。P値見た限りでは、切片も係数も、使い物になってますが・・・

せめて、
0.844,2.041873793
のように、コンマ付きで入力してください。コピペで入力するのが大変になります。
で、とりあえず、べき乗回帰はできました。

a<-rbind(
c(0.844 ,2.041873793),
c(0.83 ,5.242322324),
c(0.743 ,3.123938274),
c(0.69 ,1.288763738),
c(0.62 ,4.60944809),
c(0.42 ,0.178478931),
c(0.313 ,0.743454646),
c(0.304 ,0.87),
c(0.27 ,0.857248415),
c(0.086 ,0.171183408)
)
b<-log(a)
res<-lm(b[,2]~b[,1])
summary(res)
exp(res$coef[1]+b[,1]*res$coef[2])
a[,...続きを読む

Q標本50人で母平数20万人のアンケートの信頼率は?

掲題の通りです。調査対象者が20万人として50人にアンケートをとったデータというのは、どの程度信頼できるのでしょうか?

*お答え頂けるとき、統計学に基づくものか個人的意見かを付け加えていただけると幸いです。

Aベストアンサー

ANo.1だけじゃ足りないようなので、追加説明。

 アンケートはある質問にYesかNoかで答えるものだとしまして、「20万人のうち何人がYesなのか」を推定しようという訳です。
 まず、20万人が母集団であるから、ご質問の場合には「対象人口Nがすごく大きい」と言えます。なので、 http://oshiete.goo.ne.jp/qa/2386661.html のNo.3 に沿って計算ができます。

 「実は20万人のうち約半分がYesだった(p=0.5)」という場合に、一番性能が悪くなります。このとき、
  Mmax= 50 ≒ ((k/ε)^2)/4
すなわち
  ε ≒ k/(√(4 Mmax))
である。ご質問ではMmax=50です。推定結果に95%の信頼度(つまりk=2)を要求してみると、
  ε ≒ 0.14
である。
 つまり20万人のうちのどれだけがYesであるかの数値をpとすると、「50人に対するアンケートの結果、X%の人がYesだった」とき「pが(X-14)%~(X+14)%の範囲に入る確率が95%」ということです。
 推定結果に99.9%の信頼度(つまりk=3.3)を要求すれば、
  ε ≒ 0.23
となり、つまり「pが(X-23)%~(X+23)%の範囲に入る確率が99.9%」。 推定結果に90%の信頼度(つまりk=1.65)を要求すれば、
  ε ≒ 0.12
となり、つまり「pが(X-12)%~(X+12)%の範囲に入る確率が90%」。

 50人へのアンケートの結果、たとえば半分がYesだったとしましょう。
 その結果を受けて、「20万人の人のうち、約4割から6割ぐらいの人がYesである」と推定すると、その推定がマチガイである確率は10%よりちょっと多い。もっと確実な事を言いたければ、「20万人の人のうち、2割から8割ぐらいの人がYesである」とでも言っておく。これならマチガイである確率は0.1%未満です。だけど、「2割から8割ぐらい」じゃ範囲が広すぎて使い物にならない。

 このように、「言った事がマチガイである確率が低い」という意味での確実さと、「x割から●割ぐらい、という範囲が狭い」という意味での確実さは、両立しません。両方を良くするには、アンケートの対象人数を増やさなくてはならないわけです。

ANo.1だけじゃ足りないようなので、追加説明。

 アンケートはある質問にYesかNoかで答えるものだとしまして、「20万人のうち何人がYesなのか」を推定しようという訳です。
 まず、20万人が母集団であるから、ご質問の場合には「対象人口Nがすごく大きい」と言えます。なので、 http://oshiete.goo.ne.jp/qa/2386661.html のNo.3 に沿って計算ができます。

 「実は20万人のうち約半分がYesだった(p=0.5)」という場合に、一番性能が悪くなります。このとき、
  Mmax= 50 ≒ ((k/ε)^2)/4
すなわち
  ε ≒ ...続きを読む

Q【確率統計】99%信頼区間に6個中、5個入ること?

Aが、Bと同等であることを示したいです。

A及びBは正規分布を示し、Bはμ=100、σ=1.0という前提です。

Aを5個測定して、Bの99%信頼区間に入れば、BはAと同等であると言いたいのですが、その場合、危険率は5%となります。

測定結果が信頼区間から外れる確率は5%あるので、判定基準を5個中、5個としてしまうと厳しい判定だと思います。
そこで、6個中、5個が99%信頼区間に入ればAはBと同等と結論付けたいと思いますが、これでは判定が緩すぎると言われる不安があります。

測定のn数はこれ以上増やせません。
6個中、5個でOKとすることについて、どのように理論だてれば良いでしょうか?
また、1個は外れ値が出てもOKとすることを前提として、「6個中、5個が99%信頼区間に入る」の代案がありましたら、ご教示お願いいたします。

Aベストアンサー

> Aを5個測定して、Bの99%信頼区間に入れば、BはAと同等であると言いたいのですが、その場合、危険率は5%となります。

99%信頼区間とありますが、母平均の信頼区間ではないですよね。
多分、Bの分布の99%を覆う区間のことを言っているのだと思いますが、それを信頼区間とは呼ばないでしょう。

さて本題ですが、もしAがBと同じ分布であるなら5個のデータがすべてBの99%区間に入る確率は0.99^5=0.95099なので、確かにほぼ有意水準5%の検定になります。
一方6個中5個以上とすると0.99^5*0.01*6+0.99^6=0.99854なので、有意水準0.146%の検定になります。
データ数が異なるので一概には言えませんが、有意水準を小さくとると検出力は悪くなるので、判定が緩すぎると言われる可能性がありますね。
でしたら、99%区間ではなくもう少し狭めて有意水準を5%となるようにしては如何でしょうか?
0.93715^5*(1-0.93715)*6+0.93715^6=0.95000

しかし、この方法ではAとBが同じ分布であるという検定にはなりませんね。
平均と分散が異なっていてもBの99%区間に入いる確率が99%である分布を考えてみてください。

もし、「A及びBは正規分布を示し、Bはμ=100、σ=1.0という前提」が確かならば、Aのデータから標本平均と標本分散を計算し、μ=100、σ=1.0かどうか検定した方が良いように思います。
このとき、個々の検定の有意水準は2.5%とします。
データ数は多い方が良いので5個よりは6個ですべきです。

あと付け加えると、同等性の検定について調べてみることをお勧めします。
簡単に説明すると、統計的仮説検定は同じであるということが基本的にはできません。
そこで、ある程度以上の違いを十分な検出力で検出できるように検定し、その結果有意でなければ、帰無仮説を支持しようというのが同等性の検定です。

> Aを5個測定して、Bの99%信頼区間に入れば、BはAと同等であると言いたいのですが、その場合、危険率は5%となります。

99%信頼区間とありますが、母平均の信頼区間ではないですよね。
多分、Bの分布の99%を覆う区間のことを言っているのだと思いますが、それを信頼区間とは呼ばないでしょう。

さて本題ですが、もしAがBと同じ分布であるなら5個のデータがすべてBの99%区間に入る確率は0.99^5=0.95099なので、確かにほぼ有意水準5%の検定になります。
一方6個中5個以上とすると0.99^5*0.01*6+0.99^6=0.99854な...続きを読む


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング

おすすめ情報