ご質問させてください。
アンケートなどをするときによく有効サンプル数というものを聞きます。アンケートの大きい、少ないに関わらず、500人のサンプルがないとそのアンケートに信憑性がないといわれます。それはいったいなぜなんでしょうか?

また、街角でアンケートをよくしていますが、あのアンケートは役に立つものなのでしょうか?10人ぐらいに聞いたところで、それが、その商品の役に立つとは特に思いません。

是非とも皆さまこの疑問に対してご教授ください。ヨロシクお願いいたします。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

 私が、実際に仕事でマーケット・リサーチやアンケート等を実施する場合、その内容によって、実施法方途サンプル数は変えています。


 たとえば、サンプルを20才~25才のOLと限定し、化粧品についてのアンケートを取る場合、2つの方法があります。
 1つが「平均値」を知りたい場合であれば、最低でも100人にチェック式のアンケートを実施します。もう1つが「最新の流行」を知りたければ、流行に敏感な10人を選択し、グループ・インタビューをします。
 例外的に「深層心理」を知りたい場合は、マン・ツー・マンのインタビューをします。
 つまり、サンプル数の違いは、目的と方法の違いによるものなのです。
 なお、ご質問にあった500サンプルというのは、全国規模での調査において、調査対象者をランダムに選択するなど、500サンプル程度はないと、片寄った結果となってしまいます。
 たとえば「都市部の若い女性」の意見を聞き、その他と比較したいとします。そして500サンプルの内、男女比率が5:5であれば、男250と女250を比較することとなります。その半減した女250の中で、高齢者と若年者を比較することとなり、また半減し、地方と都市部に住んでいる人と比較すれば、また半減をします。といったように、最初から属性を絞らないでアンケートなどを実施するのであれば、絶対的な数が必要となります。この例でも「都市部の若い女性」は、500サンプル中、60サンプル程度となってしまうでしょう。
    • good
    • 0
この回答へのお礼

専門的なお立場からご回答いただきまして、ありがとう
ございました。非常にわかりやすい内容で、理解できました。

ただ、疑問なのが、全国において、500サンプルにアンケートをとり、都市部の若い女性のサンプル数が、60サンプル程度になってしまった場合、その60サンプルが妥当な数字というのはどこから来ているのでしょうか?

恐らく確立であるとか、統計のグラフであるとかそういう
ところからですかね。

それにしても助かりました!!ありがとうございます!!

お礼日時:2001/12/18 11:53

500ってどこから出てきた数字ですか?



視聴率リサーチなどだと300ってのがありますよね。

まぁ母数が多ければそれだけ平均が見えてくるのは当たり前なのでその
アンケートの内容にもよると思いますがリサーチする側がこれだけあれば
十分という母数を概算するんだと思いますよ。

どんなアンケートでもこれだけの母数があれば、というのはないと思います。
    • good
    • 0
この回答へのお礼

ご回答ありがとうございました。
500という数字は、ある人が言っていたことを
そのままいっております。

私自身、なぜ500でなく
300ではダメなのかと疑問に思いました。

お礼日時:2001/12/18 11:49

ちょっと違うのかもしれませんが、


確立の問題と似ているのではないでしょうか?
サイコロを振ったときに1~6の目が出る確立は同じですよね。
でも、1回では確立は出ませんし、10回ぐらいでも偏りが出てしまうでしょう。
でも、500回ぐらいすると確立が同じぐらいになるはずですよね。
ということは、正しい答え(アンケート結果)に近いということになると思いませんか?

街角アンケートですが、一ヶ所で10人でも、
地点が違う場所でもやっているのではないでしょうか?
    • good
    • 0
この回答へのお礼

どうもありがとうございました。
即レスで大変感動しております。

ただ、さらなる疑問が湧いてきました。
申しわけございません。

アンケートのほうですが、
なぜ、最低の有効サンプル数が、
200人、300人ではだめなのでしょうか?
200人でも300人でも一緒ではないのか?
と疑問が湧いてきました。

もしも、そういう統計、確立のいい情報
が載っているHPをご存知であれば、
ご教授いただけると
助かります。

大変ありがとうございました。

お礼日時:2001/12/12 11:05

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q統計学的に信頼できるサンプル数って?

統計の「と」の字も理解していない者ですが、
よく「統計学的に信頼できるサンプル数」っていいますよね。

あれって「この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる」という決まりがあるものなのでしょうか?
また、その標本数はどのように算定され、どのような評価基準をもって客観的に信頼できると判断できるのでしょうか?
たとえば、99人の専門家が信頼できると言い、1人がまだこの数では信頼できないと言った場合は信頼できるサンプル数と言えるのでしょうか?

わかりやすく教えていただけると幸いです。

Aベストアンサー

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。
 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル(比べるための基準となるサンプル)を比較するときに、そのサンプルの分布が正規分布(正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式)でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。それ以下では、いくらデータに差があるように見えても検定で差を検出できません。
 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合(分散値)、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された(差を出すために)必要なサンプル数だけサンプルデータを集めれば、差があると判定されます(すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる)。よって、集めるサンプルの種類により、計算上出された(差を出すために)必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。

 具体的に例示してみましょう。
 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。一見すると後者のほうが値が大きく、前者と差があるように見えます。そこで、差を検定するために、t検定を行います。結果として計算上差があり、前者と後者は計算上差がないのにあると間違えて判断する可能性の許容値(有意確率)何%の確率で差があるといえます。常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。
 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0.8とした場合に5.7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。有意確率5%で差があるとはいえない結果になります。この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551.33となり、552個もサンプルを抽出しないと差が出ないことになります。この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。

 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲(小数点何桁レベルの誤差)に納まるようなサンプル数を算出していると考えます。テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。

> どのような評価基準をもって客観的に信頼できると判断・・・
 例えば、工場で作られるネジの直径などは、まったくばらつきなくぴったり想定した直径のネジを作ることはきわめて困難です。多少の大きさのばらつきが生じてしまいます。1mm違っても規格外品となります。工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。しかし、製品をすべて調べるわけにはいきません。そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。
 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。
 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。

 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。
 ただ、経験則上指標的なものはあります。正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない(それ以下でも問題ない場合もある)とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。でも、あくまでも指標です。

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な...続きを読む

Q統計学のサンプル数2000の根拠は?

みなさんこんにちは.

既出でしたら申し訳ないですが,トリビアの泉等で何か統計を調べる際に,統計の専門家が出てきて「2000人も調査すればデータの信頼性は十分だ」などと言っていますよね.

その根拠となる数式なり方法論なりがあるのかな?と思って調べてみたらどうやら↓のページに掲載されている数式のようなのですが,このページを作られている方もその数式の妥当性に疑問を感じておられるらしく,読んでいて余計わからなくなってしまいました.

世論調査におけるサンプリング数の決定
http://www.wound-treatment.jp/next/wound225.htm

どなたか統計学にお詳しい方,簡潔に教えていただけませんでしょうか?(あまりに専門的な議論は理解不能ですのでお手柔らかに‥)よろしくお願いします.

Aベストアンサー

統計的な結果を出す際に、ある信頼度を確保するために必要となる必要サンプル数を決定することはできます。実際、臨床試験や疫学調査などでは必ず行われます。しかしその求め方は、サンプリングや割付の方法といった研究デザインや結果指標として何を見るか、どのような統計的分析方法を使うかによって変わります。それが決まったとしてもどの程度の信頼度を確保するかによって得られる必要サンプル数は変わります。
例えばご質問のリンク先に示されているのは、「単純無作為抽出で結果指標を 2 値の割合とし、正規近似に基づく 2 項確率の推定を行う」場合の式です(サイトの作者はそこまで理解はされていないようですが)。従って「単純無作為抽出で対象者を選び、内閣支持率といった割合で、その真値が極端に 0% や 100% に偏っていないと考えられる場合に、その割合を推定する」のには有効です。そうではなく例えば 2 段階層化抽出で世帯収入の平均値を推定したいといった場合にはまた違った式になります。

つまりどのような場合でも通用するような最小サンプル数といったことは本来言えませんが、ごく一般的に世論調査のような形で単純に内閣支持率のようなものを“それなりの”信頼度をもって調査するのに必要なサンプル数は、通常は 2,000 よりももっと少ないと思います。例えば関東や関西の視聴率調査などはそれぞれ 600 世帯のサンプルに基づいています。その意味で「2,000 あれば十分」という言い方は間違ってはいないと思いますが…。

しかし統計調査の信頼性はサンプル数ももちろん重要ですが、それ以上に調査対象の選定方法(サンプリング方法)が重要です。そのことに言及せずサンプル数がいくつあれば信頼性は充分などと言うのはおかしな話です。1936 年の米国大統領選挙の際にリテラリーダイジェスト社が多額の費用をかけて膨大な人数のアンケート結果を元に共和党の勝利を予想したのにもかかわらず、民主党のルーズベルトが当選して見事に予想が外れたのは有名な話です。これはその後の分析で調査対象に偏りがあったことが主な原因と言われています。

ちなみに「データの信頼性」と「結果の信頼性」は指しているものが異なりますのでご注意ください。サンプル数は「結果の信頼性」にはかかわりますが「データの信頼性」には関係ありません。対して、調査対象の選定方法は両方にかかわります。

統計的な結果を出す際に、ある信頼度を確保するために必要となる必要サンプル数を決定することはできます。実際、臨床試験や疫学調査などでは必ず行われます。しかしその求め方は、サンプリングや割付の方法といった研究デザインや結果指標として何を見るか、どのような統計的分析方法を使うかによって変わります。それが決まったとしてもどの程度の信頼度を確保するかによって得られる必要サンプル数は変わります。
例えばご質問のリンク先に示されているのは、「単純無作為抽出で結果指標を 2 値の割合とし、正...続きを読む

Q[統計]「●●な人は△△ですか?」 必要な標本数は?

俺は統計は素人です。

よく人間関係カテゴリで見かける気がする

「背の低い人はダメですか?」
とかその他諸々。

自分はあまり回答を読みに行かないのだが、自分の経験から話す人が多く、実験やらソースやらを示している人は少ないんじゃないかと考えた。

もちろん、「人によって異なる」とか「誤差が出る」のだろうけど、「日本国民の90%以上の人についてはYESである」と明言するためにはアンケートで何人ぐらいの標本を採ればいいのだろう?

教えてgooのアンケートで回答する回答者にも偏りがあるだろうが、ここでは無視したいなぁ・・・
========
うまく質問内容が伝わっているだろうか?

Aベストアンサー

 母集団である対象人口Nが小さい場合はイロイロ細かいことが出て来て難しくなりますんで、ここではNがすごく大きいとします。で、ある質問に「YES」と答える人がNp人(0≦p≦1)いるとします。
 すると、このN人の中からランダムにM人を選んで同じ質問をしたとき、「YES」と答える人の数が丁度r人になる確率は二項分布
B(M,p,r) = combin(M,r) (p^r) ((1-p)^(M-r))
になります。平均は m= Mp, 分散は σ^2 = Mp(1-p) です。
 さて、Mが大きいとき、B(M,p,r)は平均m,分散σ^2の正規分布で近似できます。従って、r/Mがm/M-ε~m/M+εの範囲に入る確率を例えば95%以上にしたければ、εM≒2σになるようにσを決めれば良い。一般にεM≒kσ(kは信頼度係数)とすると、
(εM)^2≒(k^2)Mp(1-p)
だから、
M≒((k/ε)^2)p(1-p)
となります。p=1/2のときにMは最大になって、
Mmax ≒ ((k/ε)^2)/4

 ここでさらにk=2(95%の信頼度)に固定してみると、
Mmax(k=2) ≒ (1/ε)^2
ですから、例えばMmax(k=2)=1500とすると逆に、ε≒1/√1500≒1/40=2.5ポイントと分かります。つまり、「±2.5ポイント程度の誤差を許して、95%の信頼度なら1500人ぐらい」というコトです。(±2.5ポイントっていうのは、例えば、「YESと答える人が40~45%です」という時の幅である5の半分です。)

 ところでご質問ではp=0.9ですから、
M≒0.09((k/ε)^2)
k=2(95%の信頼度)にすると、誤差範囲±2.5ポイントなら600人ぐらい、±0.5ポイントなら14000人ぐらいってこってすね。もちろん、pがあらかじめ予想できていない場合には、最悪のケース、つまりp=0.5で調査対象人数Mを決めるしかありません。

 母集団である対象人口Nが小さい場合はイロイロ細かいことが出て来て難しくなりますんで、ここではNがすごく大きいとします。で、ある質問に「YES」と答える人がNp人(0≦p≦1)いるとします。
 すると、このN人の中からランダムにM人を選んで同じ質問をしたとき、「YES」と答える人の数が丁度r人になる確率は二項分布
B(M,p,r) = combin(M,r) (p^r) ((1-p)^(M-r))
になります。平均は m= Mp, 分散は σ^2 = Mp(1-p) です。
 さて、Mが大きいとき、B(M,p,r)は平均m,分散σ^2の正規分布で近似できます。従って、r/...続きを読む

Qアンケートの集計分析の基礎(無回答の扱い、標本数など)

統計はズブの素人です。施設利用者の満足度アンケート調査をしました。集計分析について下記2点後教授お願い申し上げます。


【1】空欄・無回答の扱い?
   例えば、「あなたは○○に満足しましたか?」という設問の解答は<5:とても満足>~<1:とても不満>までの5段階での回答となっております。
   このとき、集計及びグラフ作成において、度数による棒グラフ(1は10件、2は30件、、、、)と、%による円グラフの表現がわかりやすいと考えております。
   その場合に、無回答の項目も入れるのでしょうか? 
   それてもアンケートにおいて、無回答の取り扱いは、設問の種類(単一回答か、複数科回答か、自由記載か)や内容(「利用が初めてか?」など無回答が理論的にあり得ない場合と、満足度の5段階評価のケースのように無回答が「5段階の評価では回答できない(-1だ!)」というようなことが推測できる場合、などにより対応を考えるべきなのでしょうか? 

【2】標本数について 
 施設は医療施設です。母集団は1年間の利用者数を考えるべきでしょうか? それとも一ヶ月あたりの利用者数(ほとんどの利用者が1ヶ月に一度は施設を利用すると推測できる)を想定するべきでしょうか?
 その母集団の数値(はじき出すことが可能です)を基に、信頼度とか誤差とかといった数値も出すものでしょうか? これら含めて、アンケート報告書に記載すべき基礎的なことと及び常識・慣例的なことを教えて下しさい。アンケートの結果報告書は、主に施設の管理者に対するレベル(公表が必要と判断されれば、利用者にも公開する)とお考え下さい。

 どうかよろしくお願い申し上げます。
  

統計はズブの素人です。施設利用者の満足度アンケート調査をしました。集計分析について下記2点後教授お願い申し上げます。


【1】空欄・無回答の扱い?
   例えば、「あなたは○○に満足しましたか?」という設問の解答は<5:とても満足>~<1:とても不満>までの5段階での回答となっております。
   このとき、集計及びグラフ作成において、度数による棒グラフ(1は10件、2は30件、、、、)と、%による円グラフの表現がわかりやすいと考えております。
   その場合に、無回答の項...続きを読む

Aベストアンサー

No.2で回答した者です、補足を拝見いたしました。

>利用者全体としてどのような傾向があるか
に注目している事と、設問が一つずつ独立している(らしい)という事から、「設問ごとに有効回答のみで統計、ただし無回答の人数もしくは割合も隅っこに記録しておく」というやり方が私の肌には合っていますね。

No.3様への補足中「無回答も含めるのが客観的?」に対しては、No.5様の回答「無回答は質問紙の不備だろう」と私も思います。

ところで、無回答にばかり目がいってしまったので別の観点から。
→データの信頼性、すなわち「施設利用者がへそを曲げて回答したとは言えない根拠」はとれていますか?
例えば、心の底から満足して「満足」に○をつけるのと、「何かよく分からんけれど面倒だから全部『満足』に○つけちゃえ」とは違うものと見なすべきだと思うのですが、その点はOKですか?

ってなことを考えると、そんなに無回答にこだわる意味は無いんですよ。

Qアンケートの回収率

個人あての郵送によるアンケートを実施しました。
20,000部発送し、うち3,000部が宛先不明で郵便局から戻ってきました。
回収数は2,000部で、本人死亡や白紙が100部、それ以外が1,900部でした。
この場合、調査報告書に記載すべき回収率は何%になるのでしょうか?

(1)あくまで回収数(2000)/発送数(20000)で10.0%
(2)宛先不明は除いて、回収数(2000)/実質発送数(17000)で11.8%
(3)本人死亡や白紙は無効とし、1900/20000で9.5%
(4)さらに宛先不明は除いて、1900/17000で11.2%
(5)上記以外の計算方法

こんな感じで考えてみましたが、どれが最も適切なのでしょうか?
「数学」とは直接関係ないかもしれませんが、何とぞご教示のほどお願いいたします。

Aベストアンサー

>いったい、白紙は有効なのか無効なのか、どちらに扱うべきか混乱してきました(笑)。
白紙は無効回答だと思います。
http://www.boj.or.jp/type/release/zuiji/nt_cr/kako01/ntwpi02.htm
http://www.johotsusintokei.soumu.go.jp/statistics/gaiyo/HK2006.pdf

Q統計学的に信頼できるサンプル数

統計の勉強をしておりましたらサンプルの抽出方法が下記に書いてありました。
http://www.wound-treatment.jp/next/wound225.htm

ここでは、10万人の世論調査をする場合2000人必要とのこと。
実際数式に数字を当てはめてみると10万人を超える集団になると
1500人を調査すれば傾向を把握できるということがわかりました。

ここからが疑問なのですが、
「地域別の男女の傾向を把握」したいという調査があるとします。
(東北、関東、四国・・・・のそれぞれ男女別)

東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。
すると、
東北の男性:1500人 女性:1500人
関東の男性:1500人 女性:1500人
四国の男性:1500人 女性:1500人



という調査数でよいのでしょうか??

最終的にその選んだサンプル数の全数で、「男女別の傾向」も
出したいと思っております。


普通に考えると、
人口が多い関東は、人口の少ない四国と同じサンプル数でいいのかという疑問があります。
同じ数だと、全国の傾向を出したいのに
人数の少ない四国と関東が同じであれば、四国の意見傾向にひきづられるような気がします。

そうすると調査人口は変えたほうがいいのでしょうか?
(四国を500人 500人にして、関東を2500人 2500人にするなど)

そうして人数を変えてしまうと
そもそもの、10万人の調査は1500人が必要だという統計上の件数に基づかないので
関東の人口をたとえば4000人に増やすのでしょうか?

それとも、世論調査は2000人あればいいということで
2000人を人口比率で四国・関東・・・・の男女別に割り振ればいいのでしょうか。

よろしくお願いいたします。

統計の勉強をしておりましたらサンプルの抽出方法が下記に書いてありました。
http://www.wound-treatment.jp/next/wound225.htm

ここでは、10万人の世論調査をする場合2000人必要とのこと。
実際数式に数字を当てはめてみると10万人を超える集団になると
1500人を調査すれば傾向を把握できるということがわかりました。

ここからが疑問なのですが、
「地域別の男女の傾向を把握」したいという調査があるとします。
(東北、関東、四国・・・・のそれぞれ男女別)

東北の人数も、関東の人数も四国の...続きを読む

Aベストアンサー

サンプリングの数の最小値は、それだけあれば母集団の傾向を把握できる数ですから、それ以上サンプリングの数を増やしてもあまり結果を改良できない。

>10万人を超える集団になると
>1500人を調査すれば傾向を把握できるということがわかりました。

であれば、母集団が各地域の男女ですから、
>東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。

>すると、
>東北の男性:1500人 女性:1500人
>関東の男性:1500人 女性:1500人
>四国の男性:1500人 女性:1500人
などなど
それでいいと思います。

>普通に考えると、
>人口が多い関東は、人口の少ない四国と同じサンプル数でいいのかという疑問があります。

>四国を500人 500人にして、関東を2500人 2500人にするなど

にすると四国は「サンプリングの数の最小値」を満たしていません。(計算していないので、分りませんが、500人が最小値より小さければ)一方、関東は「サンプリングの数の最小値」を満たしていますが不必要な1000人分の調査費用を無駄に使っていることになります。

一律のサンプリング数にしたければ、各地域の男女の人口から、サンプリングの数の最小値を計算し、その中の最小値プラスアルファできりのいいかずを選べばいいわけでしょう。

サンプリングの数の最小値は、それだけあれば母集団の傾向を把握できる数ですから、それ以上サンプリングの数を増やしてもあまり結果を改良できない。

>10万人を超える集団になると
>1500人を調査すれば傾向を把握できるということがわかりました。

であれば、母集団が各地域の男女ですから、
>東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。

>すると、
>東北の男性:1500人 女性:1500人
>関東の男性:1500人 女性:1500人
>四国の男性:1500人 女性:1...続きを読む

QN数?n数?サンプル数の「エヌ」は大文字?小文字?

N数?n数?サンプル数の「エヌ」は大文字?小文字?

実験や分析の際に、サンプル数を「エヌ数」といいますが、
「エヌ」は大文字なのでしょうか?小文字なのでしょうか?
そもそも決まっているのでしょうか?
定義などあれば教えてください。

Aベストアンサー

詳しい説明があったので誘導します。
http://questionbox.jp.msn.com/qa3362343.html


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング