統計学の質問です。
例えばテレビの視聴率を計算する場合、各々の世帯においてテレビを見る・見ないの2択がある
ベルヌーイ試行と捉えることが出来るので、どれだけの世帯がテレビを見るかというのは
2項分布に従うと考えることができます。
そのため、例えば100世帯を調査して30世帯がテレビを視聴していた場合、
視聴率は 30 / 100 = 30%
その誤差は2項分布の標準偏差に則って
√( (30/100) * (1 - 30/100) / 100 )= 4.58 %
なので、30 ± 4.58 % と表すことができます。
信頼区間95%にすると1.96をかければ良いので 21.02 ~ 38.98 % です。
この際、視聴率が100%もしくは0%の場合、2項分布の標準偏差が0になるので、
推定する視聴率の誤差がそのサンプル数に関わらず0になってしまうのですが、
数学的にはどう扱うのが適当なのでしょうか?
直感的にはサンプル数が多いほど100%(もしくは0%)に対する誤差も小さくなる気がするので気になります。
よろしくお願いします。
A 回答 (8件)
- 最新から表示
- 回答順に表示
No.8
- 回答日時:
もう少し、分かりやすく書くと、少々語弊があるかもしれませんが、
この結果より、±0.1%刻みで、
99%の信頼度で不良が無いことを保証するには、約4600個
95%の信頼度で不良が無いことを保証するには、約3000個
の調査が必要であると分かります。
視聴率なんて、調査数はせいぜい数百ですから、小数点以下の数値で上がった下がったと一喜一憂するのは無意味なんです。
No.7
- 回答日時:
> 例えば100世帯調べたときの0%と1000世帯調べた時の0%とでは
> 直感的にはその誤差というか信頼性が違うと思うんです。
> それを評価する方法を何かご存知ではないでしょうか?
それには、必要な信頼度Qを確保するためのn数の算出方法が
応用できると思います。
信頼度Q=0.95とか、そんな値が適用されます。
これは、同様の調査を行ったとき20回に1回は間違うというレベルです。
母不良率pのN個のサンプル中の不良数xは幾何分布に従います。
ただし、Nが十分大きい時は二項分布で近似できます。
xの確率質量分布は、次の二項分布に従います。Cは組合せの記号とします。
P(x)=NCx・p^x・(1-p)^(N-x)
ここで、pはほぼ0に近いとします。
実は、統計的には完全0%とか100%は生起し得ず、漸近するだけです。
何個調べて不良が出なければ、pが保証できるかという問題を考えてみましょう。
検出力としては、1個でも不良が出る確率を95%以上にすればよいと考えられます。
1個でも不良が出る確率は全く不良が出ない確率の排他だからです。
そのときのNを解けばよいです。
0.95 < 1 - NC0・p^0・(1 - p)^N
1 - 0.95 > 1・1・(1 - p)^N
log(1 - 0.95) > N・log(1 - p)
log(1 - 0.95) / log(1 - p) < N ・・・log(1-p)は負だから不等号の向きが変わる
不等号の左辺は、必要な調査数を与えます。
次の2事例をRで計算してみました。
> Q <- 0.99
> p <- 0.001
>
> log(1 - Q) / log(1 - p)
[1] 4602.867
>
> Q <- 0.95
> p <- 0.001
>
> log(1 - Q) / log(1 - p)
[1] 2994.234
この結果より、もしかすると0.1%の不良率が予想される場合、
99%の信頼度で不良が無いことを保証するには、約4600個
95%の信頼度で不良が無いことを保証するには、約3000個
の調査が必要であると分かります。
ご質問者様の疑問は、この逆算ケースなので、
Qの値を振ってグラフを描いて見れば、NとQの関係が出てくると思います。
全数検査に近いですね。
No.6
- 回答日時:
>100世帯調べたときの0%と1000世帯調べた時の0%とでは直感的にはその誤差というか信頼性が違うと思うんです。
それを評価する方法を何かご存知ではないでしょうか?違う番組の視聴率の数値の差から推定するぐらいしかないんじゃないですかね。
No.5
- 回答日時:
うんと大きな母集団における視聴率がp(0に近い)であるとき、サンプルn世帯中の0世帯が視聴してた、ということが起こる確率Pは、二項分布を持ち出すまでもなく
P = (1 - p)^n
すなわち
p = 1 - exp((log P)/n)
ですね。そして、「0世帯が視聴」という調査結果から pの信頼区間(CI)を推定します。たとえば 5%の信頼区間(CI)を推定してみると、
0 ≦ p <1 - exp((log(5%))/n)
だからn=10では
0 ≦ p < 0.26
ですし、n=100なら
0 ≦ p < 0.0295
ですし、n=1000なら
0 ≦ p < 0.002991
ま、細かいことを言わなければ、nがそこそこ大きい時には近似式
0 ≦ p < - log(5%)/n
で十分です。
さて、
> 推定する視聴率の誤差がそのサンプル数に関わらず0になってしまう
ということがどうして生じたのか。それはですね、
> 例えば100世帯を調査して30世帯がテレビを視聴していた場合、
> 視聴率は 30 / 100 = 30%
> その誤差は2項分布の標準偏差に則って
> √( (30/100) * (1 - 30/100) / 100 )= 4.58 %
が(厳密には)間違いだからです。
ここに出てくる「2項分布の標準偏差」が意味しているのは、「母集団の視聴率pがピッタリ30%だったときに、母集団からランダムに選んだ100世帯中の何世帯が視聴しているかを調べると、約95%の確率で30-2×4.58世帯 〜 30+2×4.58世帯という結果が出るであろう」という意味です。(だからp=0の場合、標準偏差は当然0です。)
この標準偏差は、「母集団からランダムに選んだ100世帯中で、視聴していたのが30世帯だとわかったということに基づいてpを推定する」場合のpの推定誤差の分布の標準偏差とは全くの別物です。
しかしながら、「pがマンナカへんにあって、かつnが大きい時」には、(ややっこしい議論が必要ですが)前者は後者の良い近似になることが証明できます。
で、このご質問では「pがマンナカへんにあって」という条件が成立していない状況でこの近似を使おうとしたために、話が破綻したわけです。
No.4
- 回答日時:
> X軸は何を表しているのでしょうか?
説明不足でスミマセン。
一例として、溶接における加圧力がx軸で、溶接の良品率がy軸です。
この図を取り上げた理由は・・・、
ご質問者様の疑問点である誤差がどう変化するかを論ずる際に、良品の比率が変化する事例の方が、一定確率で論ずるより良く分かると思い、確率が変化するグラフを示すことにしました。
> 直感的にはサンプル数が多いほど100%(もしくは0%)に対する誤差も小さくなる
この点について回答していませんでしたが、確かにn数が増せば推定バラツキは小さくなります。√nに反比例して小さくなります。
No.3
- 回答日時:
二値モデルの推定誤差は非対称です。
二値モデル、あるいは累積確率モデル(生存分析等)の分布曲線は、y軸が確率であるため(=上下限があるため)、尤度関数が特殊になります。
一般の推定では、「モデル残差が正規分布に従う(=対称)」という尤度関数です。
しかし、二値モデルでは、逸脱度という尤度が使用されます。
そのため、推定の良し悪しを判定する「標準誤差SE」や「決定係数R2」「モデル残差Ve」の概念も異なります。
逸脱度(deviance)とは、
・定数の場合を除いて、最大対数尤度のマイナス2倍の値。
・ただし、定数の場合は、飽和モデルがdeviance=0となるように決められる。
というものです。
例えば、添付図はy軸が確率ですが、グラフの極端なケース(両端)では誤差0に収束しますが、例えば100%という推定を行う場合、信頼区間上限は100%で誤差はありませんが、信頼区間下限にはまだ大きな誤差が残ります。
注1)赤の点線は信頼区間、青の点線は予測区間です。それぞれ上下幅が区間になります。
注2)二項分布の信頼区間は、本来離散値であるものを連続関数で置き換えて近似を行うため、様々な方法が提案されており、統計ソフトRでは実に11種類もの信頼区間が表示されます。
ご回答ありがとうございます。
逸脱度というのは初めて聞いた概念なので、勉強してみます。
このグラフについてお聞きしたいのですが、X軸は何を表しているのでしょうか?
No.2
- 回答日時:
No.1 です。
たとえば、1万世帯中にその番組を視聴していない家が 10世帯あったときに、100世帯のサンプルの中にその10世帯のうちのいずれかが含まれない限り結果は「100%」になります。
それは、0.1%という小さい確率のものを、100世帯(全体の 1%)のサンプルでは正しく推定できないということです。
回答ありがとうございます。
確率が0.1%のものを100世帯(全体の1%)のサンプルでは正しく推定できないというのはごもっともなのですが、例えば100世帯調べたときの0%と1000世帯調べた時の0%とでは直感的にはその誤差というか信頼性が違うと思うんです。それを評価する方法を何かご存知ではないでしょうか?
No.1
- 回答日時:
>この際、視聴率が100%もしくは0%の場合、2項分布の標準偏差が0になるので、推定する視聴率の誤差がそのサンプル数に関わらず0になってしまうのですが、数学的にはどう扱うのが適当なのでしょうか?
それは確率が「1」または「0」の事象ですから、結果はいくつ取って来てもばらつきません。
「男だけ」あるいは「女だけ」の母集団から採取して来れば、「必ず全部男」「必ず全部女」になるので「分散、標準偏差」は当然 0 になります。
そうではなく、確率は「1」または「0」ではないが、たまたまそのサンプルが「100%」または「0%」だったということですか?
その場合には、その「たまたまのサンプル」からは母集団の推定はできないということでしょう。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 新年・正月・大晦日 紅白歌合戦視聴率上げるための提案 2 2021/12/31 01:25
- 野球 【テレビの最高視聴率】プロ野球日本シリーズの優勝決定戦の昨日の決勝試合の優勝時の関西地 1 2023/11/06 20:09
- 統計学 統計学の質問です。 n=16のi.i.d.データを計算したところ,標本平均は400,標本分散は250 1 2021/12/26 14:42
- 数学 共分散の符号と相関係数の符号が一致する。 という正誤問題があり正でした。 たしかに標準偏差が両方正だ 2 2021/11/11 18:52
- 統計学 統計学の質問です。 どなたか分かる方教えて頂けたら幸いです。 共通]下記の仮説の真偽を判断するため, 2 2021/12/21 18:13
- 統計学 これは記述統計か推測統計どっちなのでしょうか? 1 出生率 2 内閣支持率 3 あるボクサーのK.O 4 2022/09/25 19:59
- 統計学 統計学の問題です。 どなたか分かる方いらっしゃいましたら解いて頂きたいです。よろしくお願い致します。 2 2021/12/14 17:07
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
- 統計学 [至急] 大学の統計学の問題なのですが,よろしければ模範解答を教えていただきたいです。確率分布の中で 2 2021/11/30 15:07
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
このQ&Aを見た人はこんなQ&Aも見ています
-
プロが教えるわが家の防犯対策術!
ホームセキュリティのプロが、家庭の防犯対策を真剣に考える 2組のご夫婦へ実際の防犯対策術をご紹介!どうすれば家と家族を守れるのかを教えます!
-
私の考えはどこがおかしいのでしょうか? 1/3? 1/2?
統計学
-
実験で得た傾きの値と理論値に0.09%の誤差があるのですが、許容範囲であると断定するにはどうしたらい
統計学
-
『3ℓと5ℓで8ℓ』
数学
-
-
4
鉛筆と消しゴムがセットで110円します。消しゴムは鉛筆より100円高いです。鉛筆はいくらですか?(消
数学
-
5
標準偏差について
統計学
-
6
確率の達人お願いします
数学
-
7
スクラッチは10枚買うと、1枚当たりますが、 友人は2枚だけ購入して、1枚あたりました。 友人は、『
数学
-
8
確率の達人おねがいします
数学
-
9
製品重量 規格値の設定(公差計算)についての質問
統計学
-
10
期待値がマイナスの宝くじ
統計学
-
11
質量の違いによる落下速度の違いについて
物理学
-
12
左のひしょとう関数を
数学
-
13
0を0 乗すると答えは1ですか 考え方を文章で簡単に解説 お願いします
数学
-
14
期待値と参加率
数学
-
15
期待値と参加率
統計学
-
16
一か月分の収入を12倍したら、年間の見込年収が算出されます。 例えば、6月の給料が30万円で、6月の
数学
-
17
期待値の面白い話
物理学
-
18
『[無限ホテル]』
数学
-
19
数学の確率の問題です
数学
-
20
金って、実はどこでも取れるのでは?
その他(自然科学)
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
視聴率低迷にあえぐ、ポケモン...
-
ビデオリサーチの調査に協力す...
-
大谷翔平のニュース
-
テレビの視聴率な取り方おかし...
-
バナー広告の事に質問です! 広...
-
視聴率0.1%とは全国で何人の人...
-
年齢別の視聴率(個人視聴率)...
-
地方U局の視聴率が見れるサイト
-
テレビ局はなぜ視聴率にこだわ...
-
ワンセグは視聴率に入っていま...
-
花ざかりの君たちへ 視聴率(...
-
テレビをつければ大谷、大谷と...
-
最近テレビ番組でよくやってい...
-
逮捕の瞬間にマスコミのカメラ...
-
犯罪の手口を暴いたりする番組...
-
「ありのままの世界は見えない」...
-
俳優の窪塚洋介さん、9階から...
-
車載用テレビは他県では映らな...
-
芸能人を見るならやっぱり都内...
-
テレ朝とか日テレとかそういうN...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報