プロが教えるわが家の防犯対策術!

はじめまして。5段階評価(非常に多い・やや多い・普通・やや少ない・非常に少ないのような…)の分析方法を教えてもらいたいと思っております。
一応、アンケートをとりましたが、その結果からどのようにして意味のあるデータを取り出せるかがよくわかりません。
やさしくて詳しい説明よろしくお願いいたします。

このQ&Aに関連する最新のQ&A

A 回答 (6件)

> 1.アンケートをとる時、目的のページに辿れなかった人々よりは


> その部分に関してはアンケートがとれなかったため、
> 仕方なくその部分は生データとして「0」を使用し因子分析にかけました。
> が、その部分を「0」でなく空白で処理し再び分析にかけてみたら、結果が違って出ました。
> どっちをとれば、いいでしょか?

5段階評価で1~5と数値を振っているのでしょうか?
だとしたら0を入れたら平均からして下がってしまいますよね。
欠損値(空白)として扱うか、
それでデータが極端に少なくなってしまう場合は平均値で代用するか、
どちらかの方法が使われることが多いですよ。

> 2.何とかして因子分析で3つのウェブページに対する印象というか評価が得られました。
> この後、どう進めば良いのかアドバイスをお願いいたします。

ん?因子が得られたことだけでは満足できないということでしょうか?
この後どう進むのかは何をしたいのかによります。
研究論文などでなければ、因子分析のみで終了されても十分だと思います。

何故お知り合いはどの辺りでカイ二乗検定をおすすめされているのか
本人に直接聞いた方が早いような気がしますね・・。
ちなみにカイ二乗検定は質的データ同士の関係性を探るもので
量的データの相関係数にあたるものが算出できます。
    • good
    • 2

#2,#4です。


どうやら因子分析に落ち着かれたようで
うまく行って良かったですね。

因子に意味合いを持たせるのは
本当に分析者の解釈によって様々なので
正解というのは難しいですが
もし私が質問者さんの立場だったら
こんな感じのイメージで攻めますね。

第一因子:理解のしやすさ
     (見やすい、分かりやすい、という要素に注目)
第二因子:情報の有効性
     (載っている情報が自分にとって使えるか)
第三因子:デザインの良さ
     (文字情報量が多いのはユニークさやデザイン性に欠けます、
      それがマイナスな上に色遣いが良いのですから、
      デザイン性があるのでしょう)

負荷量の大きさからイメージを探ってもいいとは思いますが
全体をまとめる言葉を捜すのも因子分析の醍醐味ですよ。

この回答への補足

あ!なるほどと感じました。ありがとうございます。
ずっと返事を待っていました。^^:ずいぶん悩んでましたので…
もう2つの疑問点があります。
1.アンケートをとる時、目的のページに辿れなかった人々よりはその部分に関してはアンケートがとれなかったため、仕方なくその部分は生データとして「0」を使用し因子分析にかけました。が、その部分を「0」でなく空白で処理し再び分析にかけてみたら、結果が違って出ました。どっちをとれば、いいでしょか?
2.何とかして因子分析で3つのウェブページに対する印象というか評価が得られました。この後、どう進めば良いのかアドバイスをお願いいたします。
知人はカイ二乗検定(?)をやって見ればといいますが、それってどうするのでしょうか?また、何の意味があるでしょうか?

補足日時:2004/11/03 22:27
    • good
    • 1

#2です。

補足ありがとうございます。

> アンケート回答数は今まで12件でしたが、
> どのくらいとればいいのか分かりません。

何ケースあれば十分という基準は特に決まっていないんですが
12件ではちょっと少ないでしょうね。
多ければ多い程良いと思います。

> 再利用へ寄与するかどうかを明らかにする

ということなので、最終的な目的として
「(4)今後利用するかどうかに関する」質問に対して
どの要素(変数)がどれだけ影響を与えているかを調べてみてはいかがでしょうか?

手始めにちょっと大きい表にはなるでしょうけど
各項目同士の”相関係数”を求めてみましょう。
関連性を示す最も基本的な指標です。
「再利用希望」に関する項目との相関係数が高ければ高いほど、
関係性が強い質問項目と言えます。
これでどの辺りに関係がありそうか「仮説」が立てられますよね。

ここで特に関係性の強いものを1つピックアップしてX軸に
「再利用希望」に関する項目をY軸として
”散布図”を描いてみると分かりやすいですね。
通常のプレゼンレベルならここまででも十分です。

もっと深く分析したい場合は・・
今回の場合は質問項目が多いですので
関連の強い項目が複数出てくることが考えられます。
となると、単なる項目1対1の相関関係だけでなく
”「再利用希望」という変数は他の項目のどれとどれを使ってどう説明することができるのか”
というようなことを調べても面白いですね。
この手法は”重回帰分析”と呼ばれ
「再利用希望」という項目を他項目による関係回帰式を使って表します。
各項目間の関係を→で表したモデルを作成することができるので
ビジュアル的にも結構分かりやすいと思います。
すごく簡単に言えば
 [質問項目A] (×1.5)→
 [質問項目B] (×0.8)→ [再利用希望の大きさ]
 [質問項目C] (×2.0)→
ってな感じですね。
式にすると
[再利用希望の大きさ]=([質問項目A]×1.5)+([質問項目B]×0.8)+([質問項目C]×2.0)
ということなんですが、モデルの方がビジュアルインパクトがあるかも。

質問項目から概念的なカテゴリを作って同じようなモデルを作る場合は
”共分散構造分析”を利用したパス図を作成することもできます。
簡単に言うと
 [質問項目A] →
 [質問項目B] → [文字のみやすさ] →
                    [再利用希望の大きさ]
 [質問項目C] →
 [質問項目D] → [シンプルデザイン]→ 
 [質問項目E] →
という感じですね。
これをやると更に具体的になりますが、
その分複雑な解析になり、意味のあるモデルを作る為には深い統計知識を要します。
(それに回答数が少ないとその分信憑性にかけるので
 せっかくここまで作っても意味がない可能性も・・)

詳しい計算方法はここには書きません。
Excelでの分析方法についての文献を参考にしてください。
http://www.amazon.co.jp/exec/obidos/ASIN/4816334 …
http://www.amazon.co.jp/exec/obidos/ASIN/4274065 …
など。

> 3つもウェブページを利用してみて検索機能に問題があるか

というのは
何をもって「問題がある」というかがポイントになると思います。
「使いにくい」というようなマイナスの質問項目があれば
上記のような方法で関連性を調べるといいのでは?

ちなみにWebページの印象について
それぞれどんな感じのイメージなのか知りたい場合は
”因子分析”を使うことが多いと思います。

参考になれば。

この回答への補足

ご返答ありがとうございました。何とかしてエクセルのアドイン統計ソフトで因子分析を行ってみました。
(1)ホームページについて因子分析(2)目的ページについての因子分析(3)全体的な検索機能についての因子分析(4)利用してみた全体的な印象についての因子分析(5)上記4つのデータについての因子分析(変数40個)をそれぞれやって見ました。
が、ここで問題が生じました。因子に対する名づけです。(5)番の場合には割りと、きれいに名づけられましたが、それ以外には微妙で、名づけるがつらいです。
例えば(5)の場合の因子と因子負荷量を並べますと、第一因子:・商品の陳列が見やすい 0.718039106 ・当ウェブページで使われているメニューや見出し、コンテンツの言葉使いは分かりやすい 0.711510936 ・全体的に情報提示方法に一貫性がある 0.559123839 ・画像情報量が多い 0.549895668
第二因子:・必要な情報が載っている 0.836468854
・今後旅行計画する時、当サイトを利用したい 0.739306526 ・重要なポイントが目立つ 0.647023056
第3因子:・色使いが適切である 0.42647798
・文字情報量が多い -0.386931856

のように結果がでましたが、私からみると、なんとなくまとまらない気がします。どのように名づければいいでしょうか?負荷量の大きい方に重みをおいて名づけてもよろしいでしょうか?

補足日時:2004/11/02 18:07
    • good
    • 0

#1です。



補足質問に関して。
その通りです。単純に平均値を出しています。ところが#2さんのご指摘のように、これだけでは「分析」にはならないんですよね。アンケートと言うか統計のマジックの理由だと思いますが「結果」を出すだけであれば、この方法が単純明快だと思います。
知人の方がおっしゃっているのは統計解析の手法だと思います。

しかし、内容を「分析」されるのでしたら#2さんのご回答にあるように「仮説」から必要になるでしょうね。
設問の仕方から大切になってくるわけです。ご質問の既にある集計から意味あるものを作り出すのは難しい気がします。(私が難しく考えすぎているのかもしれませんが)
    • good
    • 0

そのアンケートの目的は何だったのですか?


アンケートの内容はどんなものなのですか?

統計分析法にはいろいろ種類がありますが
全て「何を結論にしたいか」が決まっていないと意味がありません。
5段階評価を取っただけで”こういう分析をするべき”というのはないんです。

例えば
 ○性別などの属性によって差があることを知りたい
 ○ある企画の参加前と参加後の変化を知りたい
 ○ある商品を購入する客にどういう傾向があるのか知りたい
 ○ある質問同士に関係性があるかどうか知りたい
 ○質問項目やそれぞれのケース(被験者)をカテゴリ化したい・・等

じっくり仮説を立ててみてください。
その上で適切な分析法が知りたいというなら
多少のアドバイスはできると思います。

本格的に分析をやるつもりであれば
統計解析ソフト(SPSS、SASなど)があった方が便利です。
ないようならExcelなどで統計勉強しながら頑張ることになります。

#1さんがおっしゃっている方法ですと
非常に多いを100点満点とした場合に平均の評価がどの程度かを知ることができます。
もちろん100を基準としなくても質問項目をX軸に折れ線グラフを作ってみると
それぞれの項目で平均的にどう思われているかが分かります。
(この場合全ての尺度が同じ評価基準【非常に多い~非常に少ない】である必要がありますが。)

この回答への補足

アンケートの目的:3つもウェブページを利用してみて検索機能に問題があるか、もしあればそれは再利用へ寄与するかどうかを明らかにする
アンケートの内容:3つのウェブページに対して(1)ホームページのみの印象と利用して見たいかどうかに関する9項目の質問
(2)目的のページに辿ってその感想や求めた内容が得られたかどうかに関する12項目の質問
(3)検索機能の全般的な感想10項目の質問(4)利用してみた全般的な感想と今後利用するかどうかに関する9項目の質問
アンケート回答数は今まで12件でしたが、もうちょっと取ろうと思っていますが、どのくらいとればいいのか分かりません。
統計ソフトはなくて、今エクセルでやってみようと思っています。今、エクセル本を読んでいますが、なかなか難しいですね。アドバイスお願いいたします。

補足日時:2004/10/24 08:52
    • good
    • 0

対象によるかと思いますが。



100,75,50,25,0と点数をつけてそれぞれ回答数をかけます。合計数値を母数(アンケート回答数)で割ります。
例えば、100,75をつけた人々がいるとすれば合計値175を2人で割り87.5になり、相対的によい評価と判断できます。

この回答への補足

つまり、平均値を出して評価するということでしょうか。私の場合には、1から5までつけまして、平均値を出して棒グラフ(このグラフが効率的かどうかは知りません…)で見てみましたが、質問同士の関係というかその関連性を引き出す方法が分かりません。知人はクラスタ分析して、分散分析して、因子分析して、主成分分析して…っていいますが、私はそんな分析方法をよく分からないし、そうしてどのような結果を得られるかも正直知りません。今から私はどうすればいいのかアドバイスをお願いいたします。

補足日時:2004/10/23 02:30
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qアンケート分析に方法について

アンケートの分析について質問です。
アンケートを実施して今、分析をしているのですが
4段階回答方法①大変良い②良い③悪い④大変悪い
評価点方法について
ア)①を5点②を3点③を-3点④-5点の加点方式で平均点数を出す方法と
イ)①を5点②を4点③を2点④を1点とする加点方式で平均点数を出す方法を考えているのですが

質問としては
ア)・イ)それぞれ評価方法に名前(○○評価とか)がるのでしょうか?
よく相対評価とか絶対評価とか聞きますが?

ア)・イ)どちらの評価方法がベストなのでしょうか?
また、その理由も教えてください。
宜しくご教示お願い致します。

Aベストアンサー

選択肢に「重み(ウエイト)」をつけて平均を出す方法を「加重平均」と言いますが、このケースはあえて名前を付けるとしたら、「4段階評価スケール法」という感じかも知れません。
2つの方法が示されていますが、両方ともダメです。
普通、重みを付けるときは隣り合う選択肢と同じ間隔で重みをつけなければいけませんが、イロともに、②良い③悪いの間が等間隔になっていません。
回答者が「良い」と答える意識と、「悪い」と答える意識の、その差をスケール化して平均を出すのですから、その隔たりが大きすぎるとデータが歪む可能性が出ます。
あえて付けるなら、①を2点②を1点③を-1点④-2点とした方がシンプルです。

もしくは、質問の内容にもよりますが、4段階ではなくて5段階にした方が重みのつけ方もシンプルにできます。
例えば、「①大変良い②良い③普通④悪い⑤大変悪い」とすれば、5、4、3、2、1としたり、+2、+1、±0、-1、-2という重みを与えることが出来ます。

>よく相対評価とか絶対評価とか聞きますが?
これは全く観点が違います。
相対評価は、例えばAとBの2つの比較するものがあって、それぞれを比較して“どちらがいいか、悪いか”などを評価するものです。
①Aが非常に良い②Aがやや良い③Bがややよい④Bが非常に良い・・・というような聞き方です。
絶対評価はAとBそれぞれにおいて、“いいか悪いか”を評価するものです。
分析の際は、Aの絶対評価、Bの絶対評価をしてから、見比べて分析、そして相対評価をして分析・・・という流れです。

選択肢に「重み(ウエイト)」をつけて平均を出す方法を「加重平均」と言いますが、このケースはあえて名前を付けるとしたら、「4段階評価スケール法」という感じかも知れません。
2つの方法が示されていますが、両方ともダメです。
普通、重みを付けるときは隣り合う選択肢と同じ間隔で重みをつけなければいけませんが、イロともに、②良い③悪いの間が等間隔になっていません。
回答者が「良い」と答える意識と、「悪い」と答える意識の、その差をスケール化して平均を出すのですから、その隔たりが大きすぎると...続きを読む

Q五段階評価での有意差の求め方とグラフの偏差

こんばんわ

たとえばですが、50人に使用前と使用後の感想を
5段階(5、とても思う、4思う・・1全く思わない)評価という
アンケートの集計をやるとします。

この場合有意差を求めるとき、エクセルで
「t検定:一対の標本による平均の検定」を使用すると思うのですが、
結果がすべての項目において有意確率が低すぎ(0.00007とか・・)て
この方法であっているか不安です。

入力する数値が決まっている五段階評価で、
有意差を求めるときは、このデータ分析で合っていますでしょうか。

また、この集計の結果の平均値をグラフにするとき、
誤差?(添付参照)を入れたいのですが、五段階評価だと、
5と答える人もいれば、1と答える人もいます。この場合、
Y誤差範囲を自分で指定して入れることになると思いますが、
この数値はどうやって求めればよいでしょうか?

よろしくお願いいたしますm(_ _)m

Aベストアンサー

マイクロソフトのプログラムで悩むのは無意味です。
いろいろと変な前提条件をつけています。

設問の仕方について、余程気をつけることが必要です。
自分で良く考える事が大切でしょう。

Q統計学詳しい方、アンケート集計方法について教えてください。

ゼミの資料を作成せねばならないのですが、
どういう集計をしたら信頼性が高まるのかお知恵を貸してください。

例えば、
下記のようにシャンプーについてのアンケートを実施し、
シャンプーの満足度ランキングを作成したいと思います。

【質問】
(1)「ツバキ」をお使いの方に質問です。
選択肢1|大変良い
選択肢2|良い
選択肢3|普通
選択肢4|悪い
選択肢5|大変良くない

(2)「ラックス」をお使いの方に質問です。
選択肢1|大変良い
選択肢2|良い
選択肢3|普通
選択肢4|悪い
選択肢5|大変良くない

(3)「アジエンス」をお使いの方に質問です。
選択肢1|大変良い
選択肢2|良い
選択肢3|普通
選択肢4|悪い
選択肢5|大変悪い

(4)「SALA」をお使いの方に質問です。
選択肢1|大変良い
選択肢2|良い
選択肢3|普通
選択肢4|悪い
選択肢5|大変悪い

(5)「メリット」をお使いの方に質問です。
選択肢1|大変良い
選択肢2|良い
選択肢3|普通
選択肢4|悪い
選択肢5|大変悪い


----------------------------------------------------
【仮定】
項目1の回答数は50、
項目2の回答数は60、
項目3の回答数は1
項目4の回答数は20、
項目5の回答数は10、
----------------------------------------------------

現在このように考えています。↓

手順1.
大変良い=5点、良い=4点、普通=3点、悪い=2点、大変悪い=1点
として、全回答に点数をつけます。
項目毎の点数をだします。

手順2.
項目毎の点数を項目毎の回答数で割ります。

手順3.
項目3は回答数が、全回答数の1%に満たない為
集計結果に含めない。

どのような手順を追加すれば良いか、またはこの手順はいらないなど
教えていただければと思います。よろしくお願いいたします。

ゼミの資料を作成せねばならないのですが、
どういう集計をしたら信頼性が高まるのかお知恵を貸してください。

例えば、
下記のようにシャンプーについてのアンケートを実施し、
シャンプーの満足度ランキングを作成したいと思います。

【質問】
(1)「ツバキ」をお使いの方に質問です。
選択肢1|大変良い
選択肢2|良い
選択肢3|普通
選択肢4|悪い
選択肢5|大変良くない

(2)「ラックス」をお使いの方に質問です。
選択肢1|大変良い
選択肢2|良い
選択肢3|普通
選択肢4|悪...続きを読む

Aベストアンサー

看護師です。研究の勉強をしています。

評価の尺度が5段階ですね。これが等間隔で点数がつけられているとして結構強引に数量データとみなします。

5群を一元配置分散分析するれば、母平均に関して差があるかどうかを調べることができます。さらに、多重比較も行えばどの組み合わせで母平均に有意差があるかを検定できます。

手順に関しては、1までしか正しくありません。

2で項目毎に平均を出すのはいいのですが、標本の平均だけで差をみても意味がありません。
全数調査をするわけにはいかないからこそ、その標本で平均と標準偏差をだして、F統計量を算出します。
全数調査をしたときと同じことが危険率つきで確率的に言えるのです。

ところで、サンプルサイズですが、何人に調査するのでしょうか?その1%に満たないと集計に含めないというのは考えが違います。

QWord(ワード)でアンケートの解答を作成するには?

今、卒論でアンケートを作成しています。ワードを上で、数字で5段階の解答を作りたいんですが、良い方法が分かりません。オートシェイプで線を引いて作ってみましたが、見た目が悪く、アンケートに載せれるものではありませんでした。

作りたい解答は、横線の上に5本の垂直線を等間隔に並べ、その上に数字、文字が書かれているものです。

何か良い方法、またはソフトなどあれば教えてください。よろしくお願いします。

Aベストアンサー

「けいせん」と入力して変換すると、いろいろな線分が出てきます。
それらを使うと下記のようなものが描けますので、それを利用するとというのはいかがでしょうか。
(下記のものをコピーしても使えます)

├──┼──┼──┼──┤

おそらくこのようなものを考えていらっしゃると思うのですが…
全然違ったらごめんなさい。

Qアンケート調査のt検定

とあるアンケート調査において、買い物をする際に考慮する判断項目を10個ほど用意し、それぞれ4段評価をして頂きました。これを男女別にわけてt検定を行いたいと考えているのですが、t検定を使って問題はありませんでしょうか。F検定による正規分布には問題がないのですが、通常t検定は身長や体重などの検定に使用しており、このような4段評価の平均(2.4とか)をつかって検定することが可能なのか不安に思い質問させて頂きました。もし、t検定が行えないようであれば、別の検定手段を教えて頂ければ幸いです。勝手なお願いで恐縮ですが、よろしくお願いします。

Aベストアンサー

No1です。

>上でも紹介されていたU検定ならば正規性を必要としませんが、こちらであれ4段評価に使用しても問題ないのでしょうか。カイ2乗検定とどちらを採用すべきでしょうか。
カイ2乗検定なら出来る、と言っていないし、この場合は出来ません。私は、初心者なのですが、カイ2乗検定ならなんとか利用できます。そこで、私なら自分の力でも可能なカイ2乗検定で解析できるようなアンケートをとって始める、と言っているだけです。
 「データを集めて、それから何か検定法は」というのは初歩的な落とし穴です。まず、統計処理の方法を考えてから、その方法で処理できるようにデータを集める、というのが基本です。

 私なら、100点満点で点数化してもらいます。これだと、t-検定か、F-検定でなんとかなりそうですが。

 U検定は、『名前を聞いたことがある』程度なので・・・。

Qアンケート結果を集計するのにどの検定方法を使えばいいの

教えてください。研究に使用したいのですが、150名程度のアンケート結果と20名のアンケートの比較方法を教えてください。
去年と今年のアンケート結果を集計・比較分析するのにどの検定方法を使用したらよいのかわかりません・・・。
(1)150名程度のアンケート結果による昨年と今年の比較。回答項目は「できていない・あまり出来ていない・まあまあできている・できている」の4項目です。
さらに・・・
(2)今年度の(1)の結果と20名程度のアンケート結果の比較を行うにはどうしたらよいか
統計は全くの素人です。独学で頑張ってみたのですが・・言葉がわからず・・。どうかよろしくお願い致します。

Aベストアンサー

> 去年と今年のアンケート結果を集計・比較分析するのにどの検定方法を使用したらよいのかわかりません・・・。

本来、検定方法はアンケートを実施する前に決めておくべきものです。

(1) 「できていない・あまり出来ていない・まあまあできている・できている」をそれぞれ1~4に置き換えてMann-WhitneyのU検定を行うのが良いと思います。
検定方法は参考URLをご覧ください。

(2) 検定方法は(1)と同じでいいのですが、今年度の(1)の結果を使って2回検定することになるので、検定の多重性が問題となります。
場合によっては、多重比較をする必要があります。
http://ja.wikipedia.org/wiki/%E6%9C%89%E6%84%8F#.E5.A4.9A.E9.87.8D.E6.AF.94.E8.BC.83

参考URL:http://aoki2.si.gunma-u.ac.jp/lecture/Average/U-test.html

Q5段階評価のつけ方について

偏差値のことを調べていて疑問に思ったのですが,
5段階評価をつける際に上位7%が「5」,次の24%が「4」
次の38%が「3」というように,上位から特定のパーセンテージで5段階評価がついているようです。この,7%とか,24%とかっていうのは(偏差値でいうと,65以上,55以上…みたいな区切りだったかと思いますが),何を基準に定めているものなのでしょうか?統計学上なんらかの意味があるのでしょうか?
カテゴリが間違っているかもしれませんが,どなたかご存知でしたら教えてください。

Aベストアンサー

その数字は、統計学で出てくる「正規分布」に由来します。
標準正規分布(平均が0、標準偏差が1の正規分布)で考えますと、

 -1.5未満になる確率 6.7%
-1.5以上、-0.5未満になる確率 24.2%
 -0.5以上、0.5未満になる確率 38.3%
 0.5以上、1.5未満になる確率 24.2%
 1.5以上になる確率 6.7%

(四捨五入のため合計100%になりません)
となります。テストの成績が正規分布する場合は(実際は正規分布になりませんが)、

 偏差値 35未満 6.7%
 偏差値 35以上45未満 24.2%
 偏差値 45以上55未満 38.3%
 偏差値 55以上65未満 24.2%
 偏差値 65以上 6.7%

となります。

五段階をつけるのに正規分布から作った割合を使うのはルールを作るための一つの目安です。実際は正規分布になるとは限らないので、こういう割合にすることが統計的に妥当であるとか、妥当でないとかいうことはできません。

QExcelでのアンケート集計/分析についてご存知の人?

会社にて、アンケート分析の仕事をいただきました。10問程度の簡単な品質、対応に関する5段階評価のアンケートをお客様へし、 その結果をExcelで分析をし、グラフを作るように言われました。 簡単な何ページかの回帰分析マニュアルを上司よりもらったのですが、1ページ目が“グラフを集計した表を元に分析ツールを使う方法”が中心にかかれているのですが、 このアンケートから 集計表への段階の説明文がないのですが、なにか 関数、ツールを使うのですか? もしくは手入力?

Aベストアンサー

間に合えばいいのだけれど。

アンケート分析のグラフには、「スネークプロット」または「SDチャート」といわれる縦の折れ線グラフがよく利用されます。
このグラフを使う方法が「SD法」といわれるので、この情報を集めるといいと思います。

簡単に言うと、質問ごとに5段階の評価の回答者数を集計し、評価を「5~1」または「+2~-2」に置き換え、評価点と回答者数を掛けて、その合計を回答者数で割って平均スコアを出します。
この平均スコアをグラフ化します。

(参考:C&R研究所 出版 Excelグラフ大辞典p330,337)

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング