電子書籍の厳選無料作品が豊富!

こんにちは。検定について教えてください。
具体的には、例えば、
【質問1】料理をどのくらいの頻度でするか。
(1)毎日(2)週4~5日(3)週2~3日(4)ほとんどしない
【質問2】肌の調子は良いか。
(1)非常に良い(2)良い(3)あまり良くない(4)悪い
といった設問で4×4のクロス集計をしたとします。
このとき、二者の間に関係があるかどうかを検定したい(料理をよくする人ほど肌の調子が良い、とか)のですが、χ二乗検定でできますか?
できたとすると、期待値を求め、(期待値-実測値)二乗÷期待値の和でχ二乗の値を計算して、自由度が(4-1)(4-1)=9で5%の棄却点から16.919という値を引き出して、計算値の方が大きければ「二者の間に関係がある」というので合っていますか?
また、関係がある、となった後で、どういう関係があるのかは、「この欄の数字が多いな」なんていう、"見た感じ"で良いのでしょうか?
アンケートの集計結果を考察して欲しいと頼まれたのですが、よくわからなくて……。
よろしくお願いします。

A 回答 (2件)

カイ二乗検定で大丈夫です。

ただし,期待値に5以下のものが含まれている場合は適用すべきではないので注意が必要です。

>計算値の方が大きければ「二者の間に関係がある」というので合っていますか?

その通りです。ですが,カイ二乗検定(正確には独立性の検定)はA要因=料理の頻度とB要因=肌の調子という2つの要因間が独立であるどうかを確かめるためのものです。したがって,例えば「毎日料理をしている人が肌の調子が非常に良い」というようなことは分かりません(どの項目とどの項目とに関連があるかは分からない)。

このようなことが知りたい場合は多重比較という手法を別に適用しなければなりませんが,そうなるとかなり本格的に統計学を学ぶ姿勢が必要となってしまいます。

この回答への補足

回答ありがとうございました!

>ただし,期待値に5以下のものが含まれている場合は適用すべきではないので注意が必要です。

期待値を計算してみたところ、5以下が含まれていました。
元々の回答に偏りが多く、全体では数千の回答があるにもかかわらず、特定の項目では10以下があるのです。
こうなると、以後の計算で「二者の間に関係がある」となっても、統計学的には何ら説得力がない、ということですね?
こういう場合でも、使える検定方法はあるのでしょうか。

>どの項目とどの項目とに関連があるかは分からない

ある項目の数値とある項目の数値の差は、偶然起こったわけではなく、A要因とB要因間に何らかの関係性があるために、差ができたが、それがどんな関係性かはわからない、ということですか?
では、例えば、B要因(肌の調子)は4項目のまま、A要因(料理の頻度)を(1)毎日する(2)しない日がある、の2項目に変更すればどうでしょうか?
そうすれば、少し傾向を見てとりやすくなると思うのですが……。

追加質問ばかりですみませんが、よろしくお願いします。

補足日時:2006/09/12 20:12
    • good
    • 0

なぜかOKwaveさんからのメールが来なかったのでだいぶ過ぎてしまいましたが。

。。

期待値に5以下のものが含まれる場合は"フィッシャーのExact test"という手法を適用します(http://aoki2.si.gunma-u.ac.jp/exact/exact.html)

後者のA要因とB要因との関連性についての話題は結構ややこし部分があるので,私が曖昧な答え方をしてしまって誤解されてしまうとまずいです。したがって,以下の参考書を読むことをおススメします。

永田靖『統計的多重比較法の基礎』サイエンティスト社(特にp85~p87)
    • good
    • 0
この回答へのお礼

ありがとうございました!
これを機に勉強し直したいと思います。
参考書も探してみますね。

お礼日時:2006/09/23 21:59

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!