アプリ版:「スタンプのみでお礼する」機能のリリースについて

統計はまったく素人です。
どんな統計手法を使ったらよいか教えてください。
仮の問題です。全国とA市での数字の比較です。
以下の場合,A市は全国に比較して
うわさ好きが多いと表現しても良いのでしょうか。
けんか好きについてはどうでしょうか。
      A市  全国
うわさ好き 10万 200万
早耳    6万 600万
嘘つき   5万 500万
大食家   4万 400万
けち    3万 300万
けんか好き 3万 100万
内気    2万 200万

A 回答 (3件)

こうした比較をする場合、項目毎の割合を比較する必要があります。


A市と全国との割合は
うわさ好き:20分の1
早耳   :100分の1
嘘つき  :100分の1
大食家  :100分の1
けち   :100分の1
けんか好き:33分の1
内気   :100分の1
になります。
うわさ好きとけんか好きは、他の項目と比べて比率が高いですね。
ですから、全国の分布と比較して、うわさ好きとけんか好きは比率が高いと判断できます。
でも、A市と全国の人口が判らないので、あくまでも分布としての比較です。
A市と全国の人口の比率が、1:100であれば、うわさ好きとけんか好きは、全国平均より多いと言えますが、1:100以下であれば、すべての項目が全国平均より多くなります。

この回答への補足

分かりやすい解答ありがとうございます。こうすると確かに比較しやすいですね。ただし,この場合は他に比べてうわさ好き,けんか好きがはっきり多いとわかるのですが,わずかに多いぐらいのときは,有意差の有無といった検討が可能なのでしょうか。それともこうした比較では統計的な処理は無理なのでしょうか。A市と全国の人口が判らない場合と,わかる場合で教えてほしいのですが。

補足日時:2007/03/11 00:04
    • good
    • 0

基本的には前の人の答えですが、全国の人口とA市の人口がわかればうわさ好きだけが突飛して多いのか、ほかの者も多いのかがわかりますよ。

この回答への補足

回答ありがとうございます。
前の人にも質問したのですが,この場合は他に比べてうわさ好き,けんか好きがはっきり多いとわかるのですが,わずかに多いぐらいのときは,有意差の有無といった検討が可能なのでしょうか。それともこうした比較では統計的な処理は無理なのでしょうか。A市と全国の人口が判らない場合と,わかる場合で教えてほしいのですが。

補足日時:2007/03/11 00:06
    • good
    • 1

>わずかに多いぐらいのときは,有意差の有無といった検討が可能なのでしょうか。


今、与えられている情報だけでは検討できません。
まず、うわさ好き、早耳、嘘つき、大食家、けち、けんか好き、内気のデータ(標本データと言います)をどうやって得たのか?この方法が重要になります。
統計で重要なのは、
(1)データがある
(2)統計を行なう
(3)結果を得る
と思っているかも知れませんが実は違います。
(1)得たい情報を良く検討する
(2)どうゆう統計手法を用いれば良いか検討する
(3)その為に必要なデータを検討する
(4)調査を行いデータ分析する
(5)得られた分析結果が妥当か検証する
と言った順番になります。

うわさ好き、早耳、嘘つき、大食家、けち、けんか好き、内気といったデータは、「定性的」なデータです。そもそも、判断することが難しいデータです。(身長や体重は「定量的」なデータになります。)
うわさ好き、早耳、嘘つき、大食家、けち、けんか好き、内気か否かを判断するのは、そもそも難しいです。従って、「定性的」なデータを「定量化」する際に誤差が入ります。
また、調査の対象を絞らないといけません。
全ての年齢層で調べる事は不可能です。まず赤ちゃんや子供は、質問の意味が判らないでしょう。
当然、全員調べる事は不可能ですから、サンプリングと言う手法を用います。年齢層の人口比率や、性別、職業、年収など、全体を代表出来るサンプリング方法が重要で、実は、このサプリング方法で統計の善し悪しが決まると言って良いでしょう。
テレビの視聴率調査を思い浮かべてください。母数に対してどれぐらいサンプリングしたかで、その結果の誤差が決まってきます。
詳しくは、ビデオリサーチのHPに出ています。

ですので、既に得られた結果から、有為な差を検定することはあまり意味を持ちません。
逆に言えば、どのような調査、分析を行うかを決めだ段階で、誤差がどの程度入るのかが予測され、それ以下の微小な差異は、意味が無くなります。
視聴率の例だと、2~3%程度の違いは誤差範囲なのですね。

新薬の効果があるか否かなどの有為検定は、とても難しです。
新薬を投与するグループと、ダミーの薬を投薬するグループに分けて、効果を見ますが、個々の患者さんの症状は同じではないので、とても難しいです。良く帰無仮説という手法を用います。

色々な統計的な考え方があるので、頑張って勉強してください。

参考URL:http://www.videor.co.jp/rating/wh/tvrating.pdf
    • good
    • 0
この回答へのお礼

ありがとうございます。
>既に得られた結果から、有為な差を検定することはあまり意味を持ちません>
という部分は耳の痛い指摘です。
統計処理をしたいのなら,事前準備が必要ということですね。

お礼日時:2007/03/15 20:30

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!