プロが教えるわが家の防犯対策術!

統計はズブの素人です。施設利用者の満足度アンケート調査をしました。集計分析について下記2点後教授お願い申し上げます。


【1】空欄・無回答の扱い?
   例えば、「あなたは○○に満足しましたか?」という設問の解答は<5:とても満足>~<1:とても不満>までの5段階での回答となっております。
   このとき、集計及びグラフ作成において、度数による棒グラフ(1は10件、2は30件、、、、)と、%による円グラフの表現がわかりやすいと考えております。
   その場合に、無回答の項目も入れるのでしょうか? 
   それてもアンケートにおいて、無回答の取り扱いは、設問の種類(単一回答か、複数科回答か、自由記載か)や内容(「利用が初めてか?」など無回答が理論的にあり得ない場合と、満足度の5段階評価のケースのように無回答が「5段階の評価では回答できない(-1だ!)」というようなことが推測できる場合、などにより対応を考えるべきなのでしょうか? 

【2】標本数について 
 施設は医療施設です。母集団は1年間の利用者数を考えるべきでしょうか? それとも一ヶ月あたりの利用者数(ほとんどの利用者が1ヶ月に一度は施設を利用すると推測できる)を想定するべきでしょうか?
 その母集団の数値(はじき出すことが可能です)を基に、信頼度とか誤差とかといった数値も出すものでしょうか? これら含めて、アンケート報告書に記載すべき基礎的なことと及び常識・慣例的なことを教えて下しさい。アンケートの結果報告書は、主に施設の管理者に対するレベル(公表が必要と判断されれば、利用者にも公開する)とお考え下さい。

 どうかよろしくお願い申し上げます。
  

このQ&Aに関連する最新のQ&A

A 回答 (6件)

No.2で回答した者です、補足を拝見いたしました。



>利用者全体としてどのような傾向があるか
に注目している事と、設問が一つずつ独立している(らしい)という事から、「設問ごとに有効回答のみで統計、ただし無回答の人数もしくは割合も隅っこに記録しておく」というやり方が私の肌には合っていますね。

No.3様への補足中「無回答も含めるのが客観的?」に対しては、No.5様の回答「無回答は質問紙の不備だろう」と私も思います。

ところで、無回答にばかり目がいってしまったので別の観点から。
→データの信頼性、すなわち「施設利用者がへそを曲げて回答したとは言えない根拠」はとれていますか?
例えば、心の底から満足して「満足」に○をつけるのと、「何かよく分からんけれど面倒だから全部『満足』に○つけちゃえ」とは違うものと見なすべきだと思うのですが、その点はOKですか?

ってなことを考えると、そんなに無回答にこだわる意味は無いんですよ。
    • good
    • 2
この回答へのお礼

ありがとうございます。別の観点からの、ご指摘で、ハッとしました。
こころより感謝申し上げます。

お礼日時:2006/09/11 09:41

どちらが正しいかというよりも、むしろアンケートの性質によるところが大きいと思われますが・・・今回のケースではどちらがよいかは、私自身は判断できませんが、多くの情報を生かしたいのであれば、無回答を入れた方がよいような気もいたします。




客観性については、無回答とは関係がないように思います。というのは、無回答については、質問紙の不備だろうと考えるのが妥当だと思われるからです。無回答については確かに推測できる部分も多いですが、本当にそうであるか確かめることができませんので、主観的な判断にならざるを得ません。


有効回答率を出す場合は、基本的には完全に回答されている質問紙のみを抽出、処理することになると思います。
    • good
    • 1
この回答へのお礼

ありがとうございます。
>質問用紙の不備、と考えるのが妥当

やっと(心情的にも)理解できました。

こころより感謝申し上げます。

お礼日時:2006/09/11 09:49

円グラフなどに「無回答」や「その他」などの項目を記載しておくのはそういった項目を除外してしまうと100%にならないからでしょう。

そうなると円グラフを見た人たちは「この空白の部分はいったい何なんだ」ということになってしまいませんか?

無回答がせいぜい5%程度であれば削除したほうが良いと私は考えます。理由は必要な回答数(調査前に必要だと想定した回答数)にそれほど大きく影響するとは考えにくいからです。無回答の場合は中間の回答をしたことにして得点を割り振るような処理方法も考えられますが,このような方法に理論的な根拠はないので私は使わないようにしています。

ただし,無回答を削除する場合はその旨をしっかりと記載しておくのはいうまでもないことです。
    • good
    • 0
この回答へのお礼

ありがとうございます。
わかりやすいご説明ほんとうに恐れ入ります。

心より感謝申し上げます。

お礼日時:2006/09/11 09:51

報告書は出したことがありませんので・・・お役に立てないかもしれません。



(1)空欄・無回答の場合、いずれにせよその後の項目にもちゃんと答えているのかどうかが不安なので、私は基本的には除外しています(その代わりに有効回答率を記載しています)。
>満足度の5段階評価のケースのように無回答が「5段階の評価では回答できない(-1だ!)」というようなことが推測できる場合

というのもあくまで推測なので、質問紙を回答していただく前に回答しにくいところはないかチェックしておく必要があります(回答をみて事後判断はできないということです)。当然のことながら、どんな質問紙でも無効票はあります。あまりにも多くないのであれば、お気になさらないでもよいように思います。

(2)アンケートの目的によると思います。施設の利用者数が知りたいということでしたら、基本的には一年間の利用者数で考えたほうがよいのではないでしょうか。施設の行事は一年のサイクルで回っていると推測されますので・・・

母集団の数値は推定値になるはず(新規の人が入る可能性は全くないとはいえない)ですから、報告書では、信頼度も誤差も記載したほうがよいと思います。しかし・・・施設の利用者の人数であれば・・・約○人でもいいと私は思いますが・・・。つまり、信頼度が95%であろうが、99%であろうが、また誤差が100人であろうが10人であろうが、情報のもっている価値としては大差ないのではないかと思います(だいたい○○人くらいが利用していると分かることが管理者にとっても、利用者にとっても重要なのではないかと)。

この回答への補足

丁寧なご回答ありがとうございます。

ところでNO1様もNO2様も除外されるとのご回答ですが、公のPDF文書などをみると、各設問ごとに、満足40%不満足30%どちらでもない20%、、、、無回答3%といった報告が多く見られます。これは、一般的に慣例として計算しているのであって、本当は各設問ごとに有効回答率を出して、無回答をいれない計算・考え方が正しいのでしょうか? 
無回答の意図意思を判断できないというのはとてもよくわかります。ですが、無回答に意味があるなしを含めて客観的に判断できないが、それらを含めて統計を取ることが客観的だということで、含めて計算しているというような論理もあるのかと(多くが無回答を円グラフにいれているのをみると)。。。。??

当方の場合、結果をみると、設問によって無回答の割合に偏りがあり(無回答の割合は1%を切るものから、2~6%程度のものがあります。)、それらを含めて統計をとるのが、自然なような気がするのですが、どうなのでしょうか? やはり無回答は数にいれないで、有効回答率を出して、そのうえで計算するのが正しいのでしょうか。(また有効回答率は設問ごとに出す、と考えてよいでしょうか?) 
 
大変恐縮ですが、追加で教えていただけると幸いです。

補足日時:2006/09/08 10:49
    • good
    • 1

私も素人ですが・・・



1.
質問者様は「空欄・無回答」にもそれなりに重要な意味があるのではないか、とお考えのようですね。しかし、統計をとる上ではそのような「データを見ただけでは分からない事」は無視せざるを得ません。標本が大量に手に入ったら、1項目でも無回答の人のデータを丸々無かった事にすることさえあります。

ところで、そのアンケートが注目しているのは個人ですか?全体ですか?すなわち、「○○という傾向のある人は××、そうでない人は・・・」という型なら全てに回答した人のみのデータで、「この施設の人たちは概して○○という傾向で・・・」という型なら無回答も気にせずに統計をとる、というのが僕の考えるやり方ですね。あと、色々な質問があるようですが、その質問に相互に関連性はあるでしょうか?質問Aに5と答えたらBには1と答えるだろう、とか。だとしたら、どちらか片方でも無回答のある人のデータは無視すべきだと思います。

2.
>・・・推測できる
のならば、何年データをとろうが傾向は一緒じゃないですか?三色団子の色の比率は1:1:1ですけど、これを横にズラッと並べても1:1:1でしょ(何という例えだ、と自分に突っ込み)
それとも、時期によって回答が変わるだろう、という可能性があるのでしょうか?だとしたら月ごとにする意味はあると思いますが、その辺が鍵になるような気がします。

お力になれたでしょうか。

この回答への補足

 丁寧なご回答ありがとうございます。
 ご多忙のところ恐縮ですが、下記に当方の状況を示しますので、
当方の場合、無回答を統計に入れるかどうかご教授願えれば幸いです。

 アンケートが注目しているのは、基本的に全体です。利用者全体としてどのような傾向があるか、あるいはどのような提案・意見・不満があるかを把握したいということです。匿名による記載です。

設問は15あります。意味的には相互に関係性があるものもありますが、設問1がYESの人は設問2を回答するといった流れはありません。
     
     
 <設問1>施設の案内表示は?(満足、、不満足の5段階評価の単一回答)
      ・ 
 <設問7>電話に出るまでの時間は?(満足、、不満足の5段階評価の単一回答)
 <設問8>予約時間帯は?(満足、、不満足の5段階評価の単一回答)

といった感じです。設問7を不満とした場合、設問8も不満とする可能性が高いと推測できます。
 NO3様にも補足しておりますが、設問によって、無回答の割合に偏りがあります。

 よろしくお願い申し上げます。

補足日時:2006/09/08 11:17
    • good
    • 0

無回答の処理については対処の仕方がいろいろとありますが,私の場合,明らかに回答ミスだと分かるものや予定していた標本サイズを大きく下回らないときは処理が面倒なので,その被験者の回答を除外してしまうこともあります。



>満足度の5段階評価のケースのように無回答が「5段階の評価では回答できない(-1だ!)」というようなことが推測できる場合、

そういうことも含めて考えたうえで質問紙を実施するわけですから,実施した後に思うように行かない場合は「仕方ない」とあきらめるしかないでしょう。

1年の利用者数を想定するか,1ヶ月の利用者数を想定するかはどのような施設であるかによって変わってくるものではないのですか?例えば,あらかじめ妊婦が多い時期というのが1年の中で分かっていたとします。もしその時期が1年を通して均等であれば1ヶ月の利用者数を想定して調査を行っても問題ないでしょうが,仮に6月~8月には多くて,12月~2月には少ないといった状況であった場合は特定の1ヶ月を調査対象としてみるのは問題があるといえるでしょう。

>その母集団の数値(はじき出すことが可能です)を基に、信頼度とか誤差とかといった数値も出すものでしょうか?

母集団の数値というのは推定値なんですよね?だったら,信頼度と誤差を表記せずに報告書類を提出するのは望ましくないですね。もっとも,利用者に公開する場合は信頼区間など表記しても分かる人が少ないので必要はないでしょうが。

この回答への補足

 丁寧なご回答ありがとうございます。

 >無回答の処理については対処の仕方がいろいろとありますが
 
どのような対処方法があるのか(簡易にでも)ご教授頂けると幸いです。
公的なPDFを見ても、無回答を円グラフに入れているところが多く見られます。NO2様、NO3様にも補足追加ご教授願いましたが、当方の事情についてはNO2様の補足に記載しておりますので、NO1様からもぜひ当方の場合における無回答の取り扱いについて、ご意見・お考えを教えてもらえると幸いです。

>もしその時期が1年を通して均等であれば1ヶ月の利用者数を想定して調査を行っても問題ないでしょ う
 
 均等です。安心しました。ありがとうございます。

 >母集団の数値というのは推定値

 母集団を1ヶ月として、利用者の実数を出すことができます。アンケートは配布(無作為)した数、回収できた数があります。
 このような条件下では、どういう数値をだすと、よいでしょうか?

 ほんとうに恐れ入ります。
 どうかよろしくお願い申し上げます。

補足日時:2006/09/08 11:32
    • good
    • 2

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q複数回答のアンケート結果をグラフ化することはできますか

よろしくお願いします。

アンケートを集計している過程で、ふと複数回答をグラフ化することはできるのか?という疑問を持ちました。
いろいろ調べてみましたが、統計学が難しくてわかりません。どなたか説明していただけないでしょうか?

Aベストアンサー

> 選択肢が8つあるとします。
> それぞれ3つ選んだり、5つ選んだりした場合はどうするのですか?

そのアンケートの中身を具体的に聞いて、選択肢もじっくり考える必要がありますが、

(1) 0.333333の重み付けにする(3つ選んだ場合)
(2) 0.25の重み付けにする(5つ選んだ場合)
(3) 0.125 * 3 = 0.375(3つ選んだ場合)、0.125 * 5 = 0.625(5つ選んだ場合)の重み付けにする。

たとえば、アンケートが安い商品に関するもので、8つのうち5つ選んだすべてを買う気になれば買えるというなら(3)、
あるいは、高価な製品の場合、3つに絞った方が5つの時より買える可能性がおおきいと判断するなら、(1), (2)ではないか?

Q「無」と「未」の使い方

アンケート集計で疑問に思ったのですが、
※「無回答」と「未回答」の違いは?
※「無選択」と「未選択」の違いは?
・・・どちらが正しいのか教えてください。

Aベストアンサー

無・・・ は「ない」です。
未・・・ は「まだ・・・ない」です。
「未回答」≒ 現時点で「無回答」
「未選択」≒ 現時点で「無選択」

未には時間の概念が含まれるニュアンスかと。

Qエクセルを使用したアンケートの集計方法を教えてください。

卒業論文で、ある国と、その国の人に対するステレオタイプの研究をしています。
アンケートでは、
・外国・外国語・外国人との接触経験に関する質問 7問
・国際関係に関する知識問題 10問
・その国に関する地理的質問 5問
・その国の人のイメージに関する質問 17問
・性別、年齢、学部、学年等 5問

合計44問を調査しました。
エクセルで集計し、分析しようと思っているのですが、1行に一人分の回答を入力すると、とても見づらくなってしまうと思うのですが、こういった場合、どのような形で集計、分析する方法があるでしょうか?

エクセル初心者で、右も左もわからない状態で、本当に恥ずかしいのですが、アドバイスをいただけたらと思っています。
よろしくお願いします。

Aベストアンサー

会社員です。非常に似たことをしばしば実務で行っています。
概論としては#1さんの言うとおり、「一人一行」が鉄則。
そして、分析結果は当然別に出す、という形でしょう。

ここで問題になってくるのは、44問の設問がYes/Noの二択形式か、また選択肢形式か、自由記述形式かということ。おそらく混在でしょうか。
また、選択肢形式であっても、いずれか一つ選択、か、複数回答可か、によっても処理が異なってきます。
-----------------------------------------------------------------
最も単純な一例として、選択肢形式・いずれか一つ選択の設問ばかりとします。

・まず、Sheet1 はデータ入力用、Sheet2 は分析結果用とする。

・Sheet1 の B1から右方向に44問の設問を記入。AS1まで入りましたね。(個人的には、性別・年齢・学部などの回答者情報を頭に持ってきたほうが分かりやすいと思いますが)

・Sheet1 のA2から順にアンケート結果を入力していく。A列は番号でも振っておくとよいかも(Accessでいう主キー的なもの)。一人一行。

・例えば、アンケート回収数が100件とします。すなわち、101行目までデータが入りました。

・データベースさえしっかりしていれば、あとは分析シートで必要な項目を計算し、見やすく整理すれば良いだけ。
COUNTIF、SUMIF関数など。
もちろん、分析シートでは、各回答の回答結果だけずらりと並べても、そこから何が読み取れるかはすぐに分かりません。
したがって、

【Q1】あなたは外国人と話したことがありますか。
1、全く無い 2.ほとんどない 3・少しはある 4.とてもある

みたいな設問だったら、

1.全く無い 32
2.ほとんど無い 25
3.少しある  18
4.とてもある 20
5.無回答  5
などのようにまとめるわけです。
卒論なら見易さも考慮して、必要に応じて、パーセンテージの算出や、それを円グラフ化や棒グラフ化も必要でしょう。
------------------------------------------------------------------
【この作業の小ネタ】
◆二択形式の設問がある場合は、回答記入欄に、「はい」とか「いいえ」などを入力するのは面倒です。こういう場合は、Yesを1、Noを2と入力したりすると後から楽。

◆また、性別なども、いちいち「男性」「女性」って入力すると後から面倒です。ここは、男性を1、女性を2とか数値として入力するルールを自分で作り、後からの分析時に楽をしましょう。
学部も同様。そんなにたくさんあるわけではないでしょうから、数字に変えて入れると楽。
例)文学部=1、経済=2、法=3、など最初に自分で決めてしまえばよいのです。

◆上記例でも書きましたが、選択肢のある質問などは、分析集計時に「無回答」の欄を作っておくのがコツです。
上の例で、「男性=1、女性=2」と書きましたが、1と0にしなかったのもこのため。「無回答=0」に私はしています。

性別・学部など回答者情報の設問も同じですが。必ず空欄にする人がいますので、その件数を拾う項目がないと、「回答者総数100名」なのに、回答の合計が95、などとなって整合性がないように誤解されますし、もっとシンプルに言えば、カッコ悪いからです。(無論、複数回答可の設問はこの限りではない)

◆自由記述欄に関しては、こればっかりはエクセルの計算機能では拾えませんので、手作業でまとめるしかないでしょう。
もしアンケート回収数が膨大であるならば、同じような回答が出てくるでしょうから、これらも件数を拾い、傾向として出すのもよいでしょう。

分析手法に関しては、あなたがどのようなアウトプットを求めているかによっても変わります。
データ入力を開始する前に、まず「何を出したいのか」をよく考え、分析結果の計算の時のことまで考慮して、データベースの形式を作りましょう。とりあえずデータだけ入れといて計算する時に考えよう、では、後の祭りとなることはよくあります。

長文失礼しました。頑張ってください。

会社員です。非常に似たことをしばしば実務で行っています。
概論としては#1さんの言うとおり、「一人一行」が鉄則。
そして、分析結果は当然別に出す、という形でしょう。

ここで問題になってくるのは、44問の設問がYes/Noの二択形式か、また選択肢形式か、自由記述形式かということ。おそらく混在でしょうか。
また、選択肢形式であっても、いずれか一つ選択、か、複数回答可か、によっても処理が異なってきます。
-----------------------------------------------------------------
最も単純な一例...続きを読む

Qアンケートデータ集計したい時に…。

このカテゴリでいいのか、よくわからないのですが…。

仕事でアンケート集計をしているんですが、
(N=5,000)とか(FA=1,000)とかそのデータの対象(?)数の書き方がよくわからないので質問させてください。
職場の人に聞いても、よくわかってない人が多いみたいなので…。

(1)「N=」や「FA=」の他にどんなものがあるのか、
(2)それがどういう意味なのか、
(3)できれば、具体的に「こういう場合はこれを使う」みたいな事例をあげていただけたら嬉しいです。

よろしくお願いいたします。

Aベストアンサー

広告代理店でマーケターをやっているので
調査会社の助けがないと仕事できませんし
調査レポートには日常茶飯事的に触れていますが
調査の専門家ではありませんという前提で
>こういう使い方は通常しないものなのでしょうか。
見たことがありません。

経験的にnの表示が必要なのは、例えば
http://redribbon.yahoo.co.jp/know/inf.html
を見て頂きたいのですが
Q.エイズウイルスに感染しても、多くの場合、10年くらいは
自覚症状はありません。あなたはこのことを知っていましたか?
に対して
◆全体の77.4%が「知っている」と答えていますが
そのとき「全体とは何人だ?」が<全体(n=1398人)>であり
◆10代の83.3%が「知っている」と答えていますが
そのとき「10代とは何人だ?」が<10代(n=294人)>です。
つまり○○%と言うときの母数がnです。

また、経験的にFAとかSA、MAの表示が必要なのは
http://ma.nikkeibp.co.jp/MA/car2005/list.html
http://mnri.macromill.com/lab/002/index.html
を見ていただきたいのですが
要するに出てきた回答の形式を示すときです。

広告代理店でマーケターをやっているので
調査会社の助けがないと仕事できませんし
調査レポートには日常茶飯事的に触れていますが
調査の専門家ではありませんという前提で
>こういう使い方は通常しないものなのでしょうか。
見たことがありません。

経験的にnの表示が必要なのは、例えば
http://redribbon.yahoo.co.jp/know/inf.html
を見て頂きたいのですが
Q.エイズウイルスに感染しても、多くの場合、10年くらいは
自覚症状はありません。あなたはこのことを知っていましたか?
に対して
◆...続きを読む

Qエクセル:アンケート複数回答の集計方法

エクセル2000を使用しています。

4択のアンケートなのですが「該当するものを全てお答え下さい」という設問なので、該当箇所が1つの回答もあれば4つの回答もあります。
今は1つのセルに一人からの回答を入力してCOUNTIFで拾っているのですが、これだと複数回答の場合カウントしてくれません。

できれば問一問に対し、セルは一つにしておきたいと思っているのですが、何かいい集計方法はあるでしょうか。

Aベストアンサー

4択の選択肢は,A,B,C,Dのアルファベットで,例えばAとBの複数回答なら「AB」と入力する
回答を入力してあるセルがA1~A10

と仮定して,

Bを含む回答のカウントをするなら,

=COUNTIF(A1:A10,"*B*")

と,ワイルドカードを使って入力すれば大丈夫だと思います。

Qアンケートの集計方法について(平均や未回答者の扱いなど)を教えてくださ

アンケートの集計方法について(平均や未回答者の扱いなど)を教えてください。

1)アンケートの項目が20項目位あり、設問1でYESとお答えになった方にお聞きします。というような設問を、設問2と3に設けたところ、NOにチェックされた方も設問2と3に答えられてきました。返信があった80通のうち設問1でYESと答えた方が55人。そのうち10人はNOと答えたのにもかかわらず、設問2と3に答えてくださっています。この割合的に少し多いのではないかと思われる数値は無視して45=100%グラフを作成してもよいのでしょうか。
他の項目の未回答者は無視したのですが少し割合が多いのでどうしたものかと迷っています。
2)大変良い→5 /よい→4 /どちらとも言えない→3 /やや悪い→2 /悪い→1 というチェックボックスの数値をもとに5が15個 4が20個というような感じで集計しました。
この平均値をだすにはどうしたらよいのでしょうか。
通常3.0が普通だとして3.0からよいのか、悪いのかのかたよりを出す計算方法はどのようにしたらよいのでしょうか。
3)アンケートを配布したかず120、回収数70だとしたらこのアンケートの信頼性を出すにはどのように計算したらよいのでしょうか。また信頼度は設問毎に算出べきなのでしょうか。
よろしくお願い致します。

アンケートの集計方法について(平均や未回答者の扱いなど)を教えてください。

1)アンケートの項目が20項目位あり、設問1でYESとお答えになった方にお聞きします。というような設問を、設問2と3に設けたところ、NOにチェックされた方も設問2と3に答えられてきました。返信があった80通のうち設問1でYESと答えた方が55人。そのうち10人はNOと答えたのにもかかわらず、設問2と3に答えてくださっています。この割合的に少し多いのではないかと思われる数値は無視して45=100%グラフを作成してもよいので...続きを読む

Aベストアンサー

リサーチ屋です

まず、1)ですが、
質問1をYESと答えた人数をn数として計算すべきです(限定質問)
この文面からでは、ちょっとわからないのですが、45というのが質問1=Yesならば、
それを100%として計算するのが道理です。

2)ですが、
まず、平均には何の意味もありません。
アンケート集計では分布を重視した方が、わかりやすいはずです。
おわかりかと思いますが、「5が10票+が10票の平均3」と、「3が20票」の平均3では意味合い
は全然違います。
平均を使われるのであれば、標準偏差もつけて、その散らばり具合も加味して報告すべき
ですが、そんな数値をわかる人は普通いません。
一般的な方法は、帯グラフや円グラフで5が何パーセント、1が何パーセントと説明します。
これで、客観的にかたよりがわかるはずです。
最後は、そのデータを読み込む人の「主観」です。

どうしてもやりたければ、((5×15)+(4×20)+・・・・)/サンプル数で平均は出ますよね。
ツッコミどころ満載の値ですので、「おかしいだろ、それは!」と言われても反論できない
ですけど・・・・

3)ですが、
そもそも、サンプル数が少なすぎます。
統計的処理には向きません。ですので、信頼度云々以前の問題です。
ですので、信頼度がどうといった問題はスルーするしかないですね。
あくまでも、ひとつの参考データですが・・・・といった感じで。

統計的処理を行い、信頼度を担保する調査には、それなりの手順があります。
たぶん、無意味だと思いますし、見る人が見ればツッコミどころ満載になってしまい、墓穴
を掘ることになりますよ。
あくまでも、簡単なアンケートのレベルで押した方がよろしいかと思いますが・・・・
(ご事情はわかりませんので、勝手な判断ですが)

リサーチ屋です

まず、1)ですが、
質問1をYESと答えた人数をn数として計算すべきです(限定質問)
この文面からでは、ちょっとわからないのですが、45というのが質問1=Yesならば、
それを100%として計算するのが道理です。

2)ですが、
まず、平均には何の意味もありません。
アンケート集計では分布を重視した方が、わかりやすいはずです。
おわかりかと思いますが、「5が10票+が10票の平均3」と、「3が20票」の平均3では意味合い
は全然違います。
平均を使われるのであれば、標準偏差もつけて、その散らばり...続きを読む

Q複数回答のクロス集計の方法

クロス集計の必要性でエクセルのピボットテーブルを思い出したのですが、複数回答のようなものでうまくいかず、別に方法がないかと思いまして質問させていただきました。

概要ですが設問2と設問3がそれぞれ7個の回答選択肢より最大3個まで選択回答可になっています。
そこで設問2と設問3のクロス集計ができればと思っています。
(参考に画像を添付いたします)

詳しい方からのアドバイスがいただけますと幸いです。よろしくお願いします。

Aベストアンサー

こんばんは!

>クロス集計・・・

すなわち各設問に関して、回答結果の個数を表示したい!
というコトでよいのでしょうか?

もしそうであれば↓の画像で
L2セルに
=COUNTIF(C:E,K2)
M2セルに
=COUNTIF(F:H,K2)
N2セルに
=COUNTIF(I:I,K2)
という数式を入れ、L2~N2セルを範囲指定 → N2セルのフィルハンドルで下へコピー!
という操作を行っています。

回答順に優先順位がある場合は、それぞれの列分だけ必要になります。

※ 的外れならごめんなさいね。m(_ _)m

Qパレート図等で「N=100」とあるが、この「N」とは何の略?

パレート図等で「N=100」とあるが、この「N」とは何の略ですか?
分かっているつもりで「N数」って呼んだりしていますが、何の略か分かりませんか?
よろしくお願いします。

Aベストアンサー

number:数 です。
パレート図やヒストグラムなどでは集められたデータの個数ですね。
「N数」は、Nは幾つと言うことでしょう。
数式などでもN個などと使いますね。

Q統計処理:複数回答の群間比較方法について

若年者群(250人)と高齢者群(300人)で「健康教室」に関する情報源に関する調査をしています。

「新聞・テレビ・雑誌・本・インターネット・友人・地域講座…など10項目」から「健康」に関する情報を得ているものを選んでください、と言う質問を複数回答(多重回答?)可能として実施しました。

インターネット
若年(208人=83%)・高齢(154人=51%)

雑誌
若年(123人=49%)・高齢(94人=31%)

地域講座
若年(32人=12%)・高齢(198人=66%)

と回答があった場合、例えばインターネットと回答した割合が若年者群と高齢者群で有意な差があるかどうかの比較は行えますか?また、行えるとすれば、どのように行うのが適切でしょうか?教えてください。

他にも質問しており集計しているのですが、それらは単一回答としているので、群間でカイ二乗検定を行いました。この項目に関しては複数回答(一人がいくつ選んでも良い)なので、カイ二乗検定が行えないのかと思って、単純集計にしているのですが、何か方法はないのか?と思っています。

SPSS等は持っておらず、エクセルで処理しています。

よろしくお願いいたします。

若年者群(250人)と高齢者群(300人)で「健康教室」に関する情報源に関する調査をしています。

「新聞・テレビ・雑誌・本・インターネット・友人・地域講座…など10項目」から「健康」に関する情報を得ているものを選んでください、と言う質問を複数回答(多重回答?)可能として実施しました。

インターネット
若年(208人=83%)・高齢(154人=51%)

雑誌
若年(123人=49%)・高齢(94人=31%)

地域講座
若年(32人=12%)・高齢(198人=66%)

と回答があった場合、例えばインターネットと回答した割合が若...続きを読む

Aベストアンサー

        インターネットと回答した 回答しなかった
若年者群      w            x
高齢者群      y            z
で集計すjれば、カイ二乗検定でも大丈夫です。
選択肢の数だけ検定することになりますが。

ところで、

> 若年者群(250人)と高齢者群(300人)

群別でなく年齢でそれぞれの年齢がわかっていれば、主成分分析をしてみるというのも良いかもしれませんね。

参考URLの
タコでもわかる主成分分析
の第2章の事例3とか参考になるかと思います。

参考URL:http://home.a02.itscom.net/coffee/takoindex.html

Qカイ2乗検定って何??;;

タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

Aベストアンサー

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.

例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.

さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40

当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40
(3)ズレ    +32   -17   -14   + 9
(4)ズレ二乗 1024   289   196   81
(5)(4)÷(2) 25.6  7.225  4.9  2.025

 χ2=25.6+7.225+4.9+2.025=49.25

計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.

さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.

以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.

χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.

質問者さんの場合は

> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、

これを理論値としてうまく設定することが鍵となるでしょう.

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布...続きを読む


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング