【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】

論文を読んでいて疑問に思うことがありました.よろしくお願いします.

私は,回帰分析とは変数Yを、p個の変数X1,X2 ,… Xpにより説明したり予測するための統計的手法であり,p=1のときは単回帰分析,p>1のときは重回帰分析と呼ぶ,と解釈しています.

今,ある施設のサービス改善についての調査論文を読んでおります.そこではアンケート調査でその施設のサービスの総合評価Yと,8個の各サービス毎の評価(x1~x8)を調べ,総合評価Yを従属変数,
x1~x8を説明変数として重回帰分析にかけます.そして出た相関係数から施設の総合評価に対する各サービスの重要度を求め,改善につなげようとしています.
結果,重要度は

x1>x2>x6>x3>x7>x8>x4>x5

という結果になりました.ここまではわかるんです.

ですが次に総合評価Yを従属変数,x1を説明変数として単回帰分析,また総合評価Yを従属変数,x2を説明変数として単回帰分析,また総合評価Yを従属変数,x3を説明変数として単回帰分析・・・というようにこの操作をx8まで続け,出た相関係数を比較しています.結果は

x1>x2>x4>x8>x3>x5>x7=x6

となっており,重回帰分析の結果と照らしあわせると最初のx1とx2は合致しているものの,あとはバラバラです.x6にいたっては最後にきています.なぜでしょうか.論文は「どのサービスも総合満足度に重要な影響を与えており,特にx1,x2,x3,x4を改善するのがよい」 と締めくくっています.

質問は3点です.

(1)なぜ重回帰分析の結果と単回帰分析の結果が異なるのか
(2)どのサービスも総合満足度に重要な影響があるとして,それは重回帰分析の結果だけで言えるのではないか(重回帰でも相関係数は出ているし,単回帰分析をする意味はあるのか)

稚文ですみません.
当方あまりオツムがよろしくないのでできるだけわかりやすくよろしくお願いします.

A 回答 (1件)

(1) 重回帰分析では他の説明変数の影響を加味してそれぞれの説明変数の効果を評価するので、説明変数同士に影響がある場合には結果が異なるのがむしろ自然。



(2) 上に述べたように単回帰の結果は他の説明変数の効果を考慮していないので重回帰が良いモデルならそっちを見ればいい。

ただし、説明変数を増やしすぎて、その時解析に使ったデータに特異的にフィットさせてしまうようなモデルを作ると、現実の他のデータには合わないなんてことも起こります。また、そこらでアンケートを取った程度の大きさのデータでは、8つも変数のあるモデルを評価するにはあまり芳しくないのではないかと思います。
    • good
    • 2

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!