『L・DK』上白石萌音&杉野遥亮インタビュー!

大学で統計について勉強しています。
ウェイトバック集計について一からその概念というか、方法というか、教えて下さい。
なんとなくは分かるのですが、なんとなくしか分かりません。
具体的な数字を挙げながら教えて頂けると助かります。
よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

アンケートなどで得られた結果を元の全体(母集団)の構成比に合わせるように重み付けして計算すれば良いと思います。



例えば、ある地域にすんでいる人、一人当たりのビールの1週間の消費本数を調べようとします。その地域は、全部で1100人住んでいて、なぜか女の人が1000人で男の人が100人ということにしましょう。

で、男の人と女の人から2人ずつ合計4人にアンケートをとったらこんな結果になりました。

1 男 ビールのむ   4本
2 男 ビールのむ  10本
3 女 ビールのまない 0本
4 女 ビールのむ   2本

この平均を計算すると一人4本ビールをのむことになります。じゃあ、その地域の一人あたりのビール消費本数が平均4本かというと、ちょっとおかしいですよね。

そこで、元の全体の比率(女:男=10:1)に合うようにウエイトバックすればいいのです。

               (ウエイト値)  (乗した結果)
1 男 ビールのむ   4本    1         4
2 男 ビールのむ  10本    1        10
3 女 ビールのまない 0本   10         0
4 女 ビールのむ   2本   10        20

各々のサンプル毎にビールの本数とウエイト値を乗して、それを合計して割れば(この場合、34/22ですね)、平均1.5本となります。

ウエイト値の作り方は特にルールはなかったと思います(すいません、ここちょっと自信ないです)。

例の場合、元の母集団の合計値にあうように下記のようにしてもわかりやすいかもしれません。
この場合、乗した結果の合計の1700を1100で割って結果(1.5本)は同じですよね。

               (ウエイト値)  (乗した結果)
1 男 ビールのむ   4本    50      200
2 男 ビールのむ  10本    50      500
3 女 ビールのまない 0本   500        0
4 女 ビールのむ   2本   500     1000
--
比率の場合は、サンプルの4人だとビールをのむ人の比率は、3人/4人で75%ですが、ウエイトバックした後だと55%になります(12/22 または 600/1100)。

記憶からひっぱりだしたので完全な自信はないですが、恐らく、これでいいはず^^;

他の方間違っていたらご指摘ください。
--
ちなみに上の例だとはじめから、比率を合わせて女の人20人、男の人2人からアンケートとればウエイトバックしなくてもいいですけどね(男のサンプルが2で十分かということは別にしてですが)。
--
勉強がんばってください。
    • good
    • 2
この回答へのお礼

すごく丁寧なご説明ありがとうございました。
参考になりました。
もっと他にも深い考え方があるようなら紹介してください。
よろしくお願いします。

お礼日時:2005/04/13 01:36

No.1さんの仰るとおりでよいかと思います。



若干補足しますと、
・調査したい母集団の構成比
と、
・実際調査できる/調査できたサンプルの構成比
とが「異なる」場合に、

この「ウェイトバック」を使う、と考えればよいかと思います。
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q加重平均と平均の違い

加重平均と平均の違いってなんですか?
値が同じになることが多いような気がするんですけど・・・
わかりやす~い例で教えてください。

Aベストアンサー

例えば,テストをやって,A組の平均点80点,B組70点,C組60点だったとします.
全体の平均は70点!・・・これが単純な平均ですね.
クラスごとの人数が全く同じなら問題ないし,
わずかに違う程度なら誤差も少ないです.

ところが,A組100人,B組50人,C組10人だったら?
これで「平均70点」と言われたら,A組の生徒は文句を言いますよね.
そこで,クラスごとに重みをつけ,
(80×100+70×50+60×10)÷(100+50+10)=75.6
とやって求めるのが「加重平均」です.

Q統計学的に信頼できるサンプル数って?

統計の「と」の字も理解していない者ですが、
よく「統計学的に信頼できるサンプル数」っていいますよね。

あれって「この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる」という決まりがあるものなのでしょうか?
また、その標本数はどのように算定され、どのような評価基準をもって客観的に信頼できると判断できるのでしょうか?
たとえば、99人の専門家が信頼できると言い、1人がまだこの数では信頼できないと言った場合は信頼できるサンプル数と言えるのでしょうか?

わかりやすく教えていただけると幸いです。

Aベストアンサー

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。
 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル(比べるための基準となるサンプル)を比較するときに、そのサンプルの分布が正規分布(正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式)でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。それ以下では、いくらデータに差があるように見えても検定で差を検出できません。
 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合(分散値)、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された(差を出すために)必要なサンプル数だけサンプルデータを集めれば、差があると判定されます(すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる)。よって、集めるサンプルの種類により、計算上出された(差を出すために)必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。

 具体的に例示してみましょう。
 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。一見すると後者のほうが値が大きく、前者と差があるように見えます。そこで、差を検定するために、t検定を行います。結果として計算上差があり、前者と後者は計算上差がないのにあると間違えて判断する可能性の許容値(有意確率)何%の確率で差があるといえます。常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。
 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0.8とした場合に5.7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。有意確率5%で差があるとはいえない結果になります。この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551.33となり、552個もサンプルを抽出しないと差が出ないことになります。この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。

 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲(小数点何桁レベルの誤差)に納まるようなサンプル数を算出していると考えます。テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。

> どのような評価基準をもって客観的に信頼できると判断・・・
 例えば、工場で作られるネジの直径などは、まったくばらつきなくぴったり想定した直径のネジを作ることはきわめて困難です。多少の大きさのばらつきが生じてしまいます。1mm違っても規格外品となります。工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。しかし、製品をすべて調べるわけにはいきません。そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。
 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。
 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。

 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。
 ただ、経験則上指標的なものはあります。正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない(それ以下でも問題ない場合もある)とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。でも、あくまでも指標です。

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な...続きを読む

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Q相関分析の相関係数と重回帰分析の偏回帰係数の違いの説明

実は会社での説明に苦慮しています。
例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。
どなたかお知恵をいただきたく、よろしくお願いします。

Aベストアンサー

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チームの防御率をX1、チームの打率をx2、すなわち、説明変数を複数(2つ以上)採り、順位yの推定を行うのが、重回帰分析です。
 このように、単回帰分析よりも、重回帰分析の方が、必ず相関係数が高くなります。すなわち、結果の推定の確実性が増すわけです。相関係数が、1.0になれば、説明変数の事柄だけで、従属変数の事柄が決定できます。すなわち、100%的中します。

 単回帰では、防御率、打率とも、相互の影響は考慮されていません。従って、防御率と打率のどちらが影響力が強いのかは、相関係数から予測はできるものの、決定できません。選手をとる場合、同じ年俸を払うのに、ピッチャーとバッターのどちらを補強したら効果的かは、判断が困難です。
 このとき、どちらの影響が強いかを推定できるのが、重回帰分析です。そのために利用するのが、偏回帰係数ですが、変数の単位に左右されるので、注意を要するところです。

 「単回帰では、(1)(2)(3)のどれが最も効果的かは、判断できません」が答えでしょうか。
 釈迦に説法の点は、ご容赦を。
  

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チー...続きを読む

Qパーセンテージの平均の出し方は?

1月:90%
2月:90%
3月:86%

1月~3月までの平均のパーセンテージは?
という時に、(90+90+86)÷3
という計算方法が間違いである理由がどうしてもわからないのですが、わかりやすく教えていただけませんか?

宜しくお願いいたします。

Aベストアンサー

はじめまして。
単純に割合の平均は求めてはいけません。
割合は全体に対するものです。
例えば
1月
本が100冊売れた。 漫画本はその内50冊。
(漫画本の割合は50%ですよね)
2月
本が10冊売れた。 漫画本はその内10冊。
(漫画本の割合は100%ですよね)
3月
本が1000冊売れた。 漫画本はその内0冊。
(漫画本の割合は0%ですよね)

さて、1・2・3月トータルで漫画本の割合は
(50+100+0)/3=50でいいのでしょうか?
本当にトータルで50%も漫画本は売れたでしょうか?
本当は
1110冊売れて、内60冊が漫画本ですから、
60/1110*100=約5.4%になります

ですから、割合を出すときは
とにかく分母は全体です。
(この場合1~3月の全体が分母になります)


似た問題でAからBまで150kmを1時間、
BからCまで150kmは2時間
かかりました。
問題1.AからBの時速は
  2.BからCの時速は
  3.AからCの時速は

ここで3を求めるとき同じ距離だから、
1と2の平均を出す人がいるのですが・・・・
答えは300kmを3時間なので・・・・。
と言うことになり、単純に平均を取ればよいと言う問題ではないのです。

はじめまして。
単純に割合の平均は求めてはいけません。
割合は全体に対するものです。
例えば
1月
本が100冊売れた。 漫画本はその内50冊。
(漫画本の割合は50%ですよね)
2月
本が10冊売れた。 漫画本はその内10冊。
(漫画本の割合は100%ですよね)
3月
本が1000冊売れた。 漫画本はその内0冊。
(漫画本の割合は0%ですよね)

さて、1・2・3月トータルで漫画本の割合は
(50+100+0)/3=50でいいのでしょうか?
本当にトータルで50%も漫画...続きを読む

Qn数?N数とはどのような意味ですか?

こんにちは。
よく、サンプルテスト等でn数?N数という言葉を聞くのですがどのような意味ですか?
テスト回数を意味するのでしょうか?

ご存知の方、教えてください。
宜しくお願い致します。

Aベストアンサー

[簡単な例]
りんごの重量を10個量ってみた
→n=10

nはnumberの頭文字です。

QexcelのVLOOKUPで検索値を2つにできますか?

excelのVLOOKUPで検索値を2つにしたいです
私の知っているVLOOKだと下記のことは対応できます
例えば、A列に会社名、B列に住所、C列に電話番号 とあった場合
「住所が検索値と同一なら電話番号を表示しなさい」という指示は出せます

そこで質問です
「会社名と住所が検索値と同一なら電話番号を表示しなさい」
というような、複数の検索値を持つ事はできないのでしょうか?

参考になるURLなどでも結構ですので、ご存知の方よろしくお願いいたします

Aベストアンサー

元の表をA列に会社名、B列に住所、C列に「=A2&B2」、D列に電話番号のようにして
=VLOOKUP(会社名&住所,$D$2:$C$100,2,FALSE)
のようにすれば可能です。

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Qエクセルのセルにある同じ値が何件あるかを調べたいのですが・・

教えてください。
マイクロソフトエクセルで各セルの値が何件あるかを調べたいのです。
例えば
A1セルに4300
A2セルに1500
A3   1000
A4   4300
A5   1000
・・・・・
など同じAセルに約300近くの値が入っていたとします。
この場合
4300 は 2件
1500 は 1件
1000 は 2件など「件」はつかなくて数値だけでも助かります。
代金の返金をする時に紙幣や硬貨を用意する為に同じ値がいくつあるかが知りたいです。
オートフィルタで同じ数値だけを出す方法もありますが、こちらの方法で出来ることでしたら教えて下さい。
宜しくお願い致します。
エクセルのバージョンは古くて2002です。

Aベストアンサー

こんばんは!
色々方法はあるかと思いますが・・・

一例です。

↓の画像のようにB列を作業用の列とさせてもらっています。

B2セルに
=IF(COUNTIF($A$2:A2,A2)=1,ROW(A1),"")
という数式を入れオートフィルでずぃ~~~!っと下へコピーします。

そして、D2セルに
=IF(COUNT($B$2:$B$1000)<ROW(A1),"",INDEX($A$2:$A$1000,SMALL($B$2:$B$1000,ROW(A1))))

E2セルに
=IF(D2="","",COUNTIF($A$2:$A$1000,D2))

という数式を入れ、D2・E2セルを範囲指定し、E2セルのフィルハンドルで
下へコピーすると画像のような感じになります。

尚、数式は1000行目まで対応できるようにしていますが、
データ量によって範囲指定の領域はアレンジしてみてください。

以上、長々と書きましたが
参考になれば幸いです。m(__)m

Qアンケート調査でのサンプル均等割付

アンケート調査でのサンプル割付について質問です。年齢で均等割付を行った場合、どのような点についてデータを解釈すれば良いのでしょうか?
例えば、↓この調査では年代が均等割付です。新製品の認知率26%と見出しに謳っていますが、母集団を反映しているわけではありません。この場合、単に調査対象300人の意見に過ぎず、“それで?”という、私個人としては、経験の少なさから、あまり発展性のない見方しかできません。
http://c-news.jp/c-web/ShowArticle.do?did=01&aid=00011693

サンプルの代表性についての話はよく聞きますが、このように均等割付のアンケートも実際にとり行われているところを見ると、何かしらの意味があるようにも感じます。どのように意味合いを見つけ出せばよいのでしょうか?

アドバイス、ご意見のほど、よろしくお願いします。

Aベストアンサー

お考えの通りで、例としてあげられている調査結果には、ほとんど意味がありません。調査会社が仕組みの宣伝というか、営業のためにやっているだけです。サントリーや競合会社がこのデータを参考にすることは無いでしょう。
どう解釈すればという意味では、「知っている人がいないわけじゃないが、それほど多くもない」という程度でしょうか。ネットパネル自体が特殊なので、飲料の認知に関してどの程度のバイアスを見ておくべきかは、この調査だけでは何とも言えませんが。
同じ形式で毎回新商品について調査し続けるのであれば、ひとつの指標として使えるとは思います。

(均等)割付については、「全体からサンプリングすると重要なセグメントのサンプル数が少なくなる」場合に利用します。例えば、民間企業の調査を普通に行うと、従業員の多くを抱える大手企業の数が非常に少なくなる(企業数は圧倒的に中小が多い)ため、規模別に割付をします。
そう言った場合、集計はウエートバックして全体値を参照するか、そもそも全体値が目的でない場合は割り付けした層ごとの集計だけを見ます。

例の場合は、層別にみようとしてもサンプルが少なすぎ、その面でも使えません。

20年ほど前には、サンプリングがいい加減な調査を記事にする新聞記者は少なかったのですが、特に最近のネットメディアはリテラシーが無く、無批判に記事を垂れ流すので困ったものです。読み手が取捨選択するしかないですね。

お考えの通りで、例としてあげられている調査結果には、ほとんど意味がありません。調査会社が仕組みの宣伝というか、営業のためにやっているだけです。サントリーや競合会社がこのデータを参考にすることは無いでしょう。
どう解釈すればという意味では、「知っている人がいないわけじゃないが、それほど多くもない」という程度でしょうか。ネットパネル自体が特殊なので、飲料の認知に関してどの程度のバイアスを見ておくべきかは、この調査だけでは何とも言えませんが。
同じ形式で毎回新商品について調査し...続きを読む


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング

価格.com 格安SIM 料金比較