![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?e8efa67)
No.4ベストアンサー
- 回答日時:
#3です。
補足コメントありがとうございます。書いて頂いたとおり「『駅から遠ざかり』店舗面積を増やすと売り上げが良くなる」
あるいは「駅に近く『店舗面積を減らす』と売り上げが良くなる」という、「どちらかの変数が逆転する」という現象が生じますね。
本来なら「駅に近く店舗面積を増やすと売り上げが良くなる」ハズですよね。実は店舗面積はほぼ一定なので無相関です。だから事実としては、「駅に近く駐車場面積を増やすと売り上げが良くなる」ですが、駐車場の面積は変数に入っていません。この影響がどちらかの変数の効果を狂わせます。
このような前方媒介変数の影響は、観測されているx1,x2から計算したVIFやCNには現れませんので、一般の解析者はミスリードに気づくことができません。
このような状況に陥らないためには、ドメインの知識や業務の理解が重要だと思います。「これって、係数の符号が逆じゃない?」「これって、駐車場の広さが効いているんじゃない?」と気づくことができるかどうかです。
この回答へのお礼
お礼日時:2021/09/22 16:17
拙い質問をくみ取っていただきありがとうございます。
ミスリードを起こさないためには、手法どうこうより、
結果を鵜呑みにせず、分析対象の性質を考慮して結果を考察するのが大切ということですね。
VIF、CN、また相関係数行列などについて詳しく調べてみます。
丁寧にご回答頂きありがとうございました。
No.3
- 回答日時:
結論をミスリードするようなケースを未然に防ぐ方法として指標値VIFとCNがあります。
VIF(Variance Inflation Factor)はある説明変数を目的変数として他の説明変数で回帰を行ったとき、どれだけ説明を受けているかの指標です。
説明変数ごとに計算されます。
小さいほど良いです。最良が1です。5以下であることが望ましいとされています。
CN(Condition Number)は説明変数全体の従属性の指標です。説明変数の分散共分散行列の最大固有値を最小固有値で割ったものです。
線形制約があると最小固有値がゼロ漸近しますので、CNは膨大化します。
説明変数全体を評価する指標です。
小さいほど良いです。最良が1です。10以下が望ましいとされています。
これらは大抵の統計ソフトは表示してくれるハズです。
ただし、これで見つからないのが、前方媒介という厄介な潜在変数の存在です。(→は「影響を与える」と読んでください)
駅からの距離→売り上げ
(店舗面積→駐車場の面積)→売り上げ
駅からの距離を考慮しなければ、店舗面積が大きいときは駐車場は狭くなります。それらが総合して売り上げに寄与します。これらは相殺して、売り上げへの寄与は見られないかもしれません。
ここで、駅からの距離と店舗面積の関係を調べても異常は見つかりません。
しかし、併せて解析を行うと、駅からの距離は駐車場の面積に影響を与え、()内の見かけ上の効果を狂わせます。
駐車場の面積は観測されていない変数で、しかも、取り上げた変数の後方ではなく前方にありますので、前方媒介変数と言います。
No.2
- 回答日時:
類似の現象が起きるケースを事例で説明します。
①コンビニの売り上げ
店舗面積x1と売り上げyの相関は無かった。
駅からの距離x2と売り上げyには負の相関が見られた。
店舗面積x1と駅からの距離x2には相関は無かった。
でも、重回帰分析を行うと店舗面積x1が効いていた。
これは、駅からの距離を変数に加えると、実は駐車場の面積は増えているというプラスの潜在効果が店舗面積という項に現れてくるのです。
このケースでは、結論をミスリードしますので注意が必要です。
②学歴と年収(逆のケースです)
最終学歴x1と年収yには相関が見られた。
高度な資格(医師,パイロット等)x2と年収には相関が見られた。
最終学歴とx1と資格x2には相関が見られた。
重回帰分析を行うと最終学歴x1の効果は無かった。
これは、削除変数バイアスの一種です。片方の因子で説明ができてしまうと、もう片方が説明に寄与できなくなるという現象です。
どんな研究をされているか分かりませんが、潜在因子や疑似相関を慎重に調べられることをお勧めします。
ついでに、
ごめんなさいね。既に閉じられているご質問への口出しです。
前問(相関係数と回帰係数に関するご質問)でyhr2さんが、
「相関係数は、2つの変数間の「直線的な関係の強さ」を示す指標です。
変数が3つ以上になったら使えません。」
と回答されていますが、間違いです。
何次元であっても、相関係数行列として計算されます。
間違いを指摘しようと思っていたら、閉じられてしまいましたので・・・。
以下は説明です。無視して下さい。
例えば、x,y,zの3次元区間で、データが葉巻型UFOのような回転楕円体の形に分布しているとします。
このx,y,z軸を全て1に基準化したときの共変量が相関係数行列に一致します。
x,y,zの列を持つデータ配列をXとすると(行数はnとします)、
多次元の内積(XTX)(Tは転置)は分散共分散行列のn倍になります。
XTXをデータ数nで割った各要素を、対応するXTXの右下がり対角成分の各要素(分散)の平方根で割れば相関係数行列になります。
あるいは、x,y,zをそれぞれ基準化してXTXを計算しnで割れば相関係数行列になります。
No.1
- 回答日時:
x1とx2との相関が無い、すなわち独立であるときには、そのような現象は生じ得ません。
x1からyに向かうパスが、直接パスも、x2を経由するパスも無いわけですから。
独立であれば、交互作用項を設けることができ、もしかすると、x1の寄与も観測されるかもしれませんね。
交互作用項は、それぞれの平均を引いて中心化したものを掛け合わせ、x1x2という項を新たに作ります。それを加えて重回帰分析をすれば良いです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 統計学 マルチレベル分析について 2 2023/02/21 09:36
- 統計学 学業成績に関する重回帰分析の見方について 4 2022/06/06 17:19
- 心理学 満足度調査の回帰分析 0 2023/05/11 08:39
- 大学・短大 大学 統計学 2 2022/09/18 15:06
- 統計学 【統計 回帰分析 ダミー変数について】回帰分析に曜日みたいなダミー変数を設定する場合って、ダミー変数 1 2023/01/14 17:00
- 統計学 回帰分析検証不一致 5 2022/05/04 20:48
- 統計学 Rでnnetを用いて回帰分析を実装しました。この実装結果の利用方法がわからない。 5 2022/12/27 18:58
- その他(プログラミング・Web制作) 下記内容はpythonの重回帰分析で可能でしょうか? python初心者です。現在の業務でもしかした 2 2022/06/16 00:36
- 統計学 卒論でエクセルの単回帰分析を使用して分析を行いました。結果は出たのですが、どの数値をどのように論文に 2 2023/01/10 03:17
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
散布図の近似曲線の傾きがマイ...
-
Excelの相関関数「Correl」の-0...
-
相関係数って
-
重回帰分析で得られた予測式の...
-
3変数の相関
-
SQLの副問い合わせと相関副問い...
-
相関の表現について(高い、強い?)
-
相関係数Rの2乗について
-
二つのデータの波形が似てるか...
-
決定係数がマイナスになる例っ...
-
切片あり回帰と切片なし回帰
-
修正済み決定係数(R2乗)がマ...
-
変動係数(SD/平均)を有意差検定...
-
ある1点で傾きが急激に変化する...
-
サンプル数の違うものの比較
-
VB.NETでODBC接続のデータベー...
-
回帰関係の有意性と回帰係数の...
-
1.5mlのエッペンチューブに入っ...
-
微分方程式と回帰分析の予測方...
-
numbersで重回帰分析をしたい
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
おすすめ情報
kamiyasiro様
非常に分かりやすいご説明ありがとうございます。
説明変数同士に相関がないようにみえても
「説明変数と目的変数を媒介する因子」と説明変数の相関に注意しなければならないということですね。
事例①の重回帰分析の結果について、
(売上)=a1×(店舗面積)+a2×(駅からの距離)+b
という回帰式が求まると思います。
・このa1は(駅からの距離)が一定の場合の「(店舗面積)の(売上)への影響」を表す
・(駅からの距離)→(駐車場面積)なので、(駅からの距離)が一定ならば(駐車場面積)が一定
・すると(店舗面積)と(駐車場面積)の(売上)への効果が相殺することなく(店舗面積)が見かけ上影響あるように見える
というイメージで間違いないでしょうか?
また、確かにこのケースでは「駅からの距離と店舗面積を増やすと売り上げが良くなる」
という駐車場面積を考慮していないミスリードを起こしてしまいそうです。
駐車場面積を考慮するにはどのような分析をすべきだったのでしょうか。