プロが教える店舗&オフィスのセキュリティ対策術

統計の信頼性について聞きたいです。数学的に知りたいです。選挙とかで、選挙結果の前に予想とかありますよね?ああいったデータってどれくらい信頼できるんですか?アンケートとってアンケート結果から予測してるわけですよね?
つまり、20歳以上、今だったら18歳以上の人口全てにアンケート取らず、その一部からあたかも全体の予想の如くしているわけですよね?本当に信頼できるんですか?数学的に知りたいです。
選挙人口か1億人だっとしたら、どれくらいのサンプルを取ればいいんですか?1億人で仮に1000万のサンプルアンケートだったら信頼性は10パーセント%じゃないんですか?
残り9000万が全く反対の政党支持し出したら全然結果変わりますよね?この計算方法違いますか?
正規分布かなんかで信頼性求めたような、、すっかり忘れてしまいました、、

A 回答 (5件)

1億人だっとしたら、2000人で充分余る。


詳細は研鑽して下さい。

こういう問題には必ずチャチャ入れて来る人が居るから、その回答見て下さい。
    • good
    • 0

>ああいったデータってどれくらい信頼できるんですか?



通常は「信頼度95%」(信頼水準)で、「サンプル」から「母集団」を推定します。
ここでいう「信頼度」とは、統計的に「正規分布」の「95%信頼区間」の中に入る、つまり「全体の度数の95%がその範囲に入る」という意味です。
もちろん、「信頼度99%」にすることもできますが、そのためにはサンプル数を増やす必要があります。

「信頼度」以外に「精度」というものもあります。精度が「1%」で「内閣支持率は、95%の信頼度で 39%」といったときに、実際の内閣支持率が「39 ± 1 %」といった意味です。

統計的な話としては、下記のようなサイトをご確認ください。
http://www.stat.go.jp/koukou/trivia/careers/care …

さらに理論的なバックを知りたければ、「正規分布」とか「母集団からのサンプリング」「サンプルからの母集団の推定」といったあたりを勉強してください。

>選挙人口か1億人だっとしたら、どれくらいのサンプルを取ればいいんですか?

 1000~2000人のデータがあれば、「信頼度95%」「精度2~3%」で推定できます。

>残り9000万が全く反対の政党支持し出したら全然結果変わりますよね?

ランダムにサンプリングしたときに、サンプルと母集団がそんなに食い違う確率は統計論から計算できます。それは当然「1%よりもはるかに小さい、極めて低い確率」ですから、「信頼度95%」の範囲内では「あり得ない」として無視します。
    • good
    • 0

No.2です。

ちょっと補足。

「統計」って、最終的には「確率」の話をしています。
信頼度95% = 95%の確率で「正しい」が、5%の確率で「間違っている」かもしれない。
でも、5%未満の確率の出来事はめったに起こらないから、5%未満の確率は捨てて、95%の確率で起こることを「正しいと推定」することにしよう、ということです。

基本は、「独立な事象をランダムに採ってくれば正規分布する」、正規分布の「確率」は「平均値」から「標準偏差の何倍離れているか」が分かれば推定できる、ということに基づく「論理的な推論」なのです。
↓ 正規分布の特性
標準偏差を「σ」として、
  Z=平均値± σ の範囲に、全体の度数の 68.3% が入る
  Z=平均値±2σ の範囲に、全体の度数の 95.4% が入る
  Z=平均値±3σ の範囲に、全体の度数の 99.7% が入る
http://www.stat.go.jp/koukou/howto/process/p4_3_ …
    • good
    • 0

何かを判断するときに、サンプリングをして一部のランダムな対象の結果から全体、つまり母集団を推定する手法は統計学的には一般的なやり方です。



ただし、それが成立するためには様々な制約や条件があったりもするので、実際の結果と異なることはまれにあります。

統計学を勘違いしてる人は、それがゼロ百のような考え方ができると勘違いする人も多いですが、あくまで信頼区間やt検定のp値なんかもですが、それは前提が成立した場合にどの程度の範囲で有効かを踏まえての値ですから、その条件をより厳しくしなくてはいけない場合もあれば、実用的には緩くても全く問題ない場合があるのです。
    • good
    • 0

問題は数学じゃないところにあるってのが答えです。



数学的なところは他の方々が回答している通りです。納得行かないなら統計学の入門書でも読んでください。普通の感覚で言えば番狂わせは起きません。というより、サンプル数として統計学的な基準をクリアできていないものを世論調査としてニュース報道することなんて恥ずかしくてできないはずです。

しかしながら、統計学は「無作為抽出」を前提にしています。実際の世論調査はそうなっていません。よく言われるのは、ランダムな電話番号にかけたと言いながら携帯ではなく固定電話にかけている、そうすると今どきの一人暮らしの若者なんて固定電話引いていないから年齢構成が著しく偏ることになります。

さらに言えば、もう十年近く前でしょうか、ネット上で「出口調査は民主党」というのが流行りました。選挙結果は全開票されるはるか前に、出口調査の結果に基づいて当選確実と発表されるのですが。民主党嫌いな人達が、彼等をぬか喜びさせてやろうとやっていた一種の悪戯です。どの程度影響あったのかは不明ですが、調査に対して実際の投票と違うことを言われた日には、もはや無作為抽出どころか抽出ですらありません。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!