プロが教えるわが家の防犯対策術!

従属変数についての質問。

多変量解析を行う場合従属変数を決めます。で、例えば従属変数が「疾患がある」と「疾患がない」という2値になるものにしようと設定したとします。その場合、変数としては「ない=0」「ある=1」としなければいけないのでしょうか?

自分の考えとしては、たぶんこれはダミー変数だと思いますが、2値だからロジスティック回帰で分析する場合、疾患のある・なしを確率でとらえるなら、確率は0~1までなので「ない=0」「ある=1」としておかなければダメなのでしょうか? 例えば「ない=1」「ある=2」としてはダメなのですか?

あと、ロジスティック回帰の結果、従属変数に対する独立変数のそれぞれが調整オッズ比とその95%CIという形でよく論文に表が載せてあるのですが、・・・その解釈の仕方として、独立変数が「男」「女」の場合のような2値なら男より女は相対危険(オッズ比)が「いくらです」。という解釈ですよね。しかし、独立変数が「年齢」や「身長」など連続的な数量データなら、オッズ比に関してどう解釈すればよいのでしょうか? また、「年齢」が例えば4層くらいのわけてあったりもしますが、結局、オッズ比の解釈がわかりません。
結構権威ある先生の論文に年齢のところは「1歳の増加」とか書いてあって、そのオッズ比と95%CIが書いてありますが・・・
「1歳の増加」? 意味がよくわかりません。連続データの独立変数の場合、「1の増加」に対するオッズ比と解釈しなければいけないのでしょうか?

A 回答 (1件)

疾患あり=1,疾患なし=2とする。

これについては,割り振る数値は何でも問題ありません。極端な話,疾患あり=109837,疾患なし=0.0098としても良い(この場合において数値自体には意味がないので)。

ただダミー変数に割り振る際にはそのようには行きません。2値だと分かりにくいかもしれませんが,例えば疾患あり=1,疾患なし=2,不明=3とでもしておきます。これをダミー変数に置き換えると,

疾患あり(d1)|疾患なし(d2)|不明(d3)
1 | 0 | 0
0 | 1 | 0
0 | 0 | 1

というようになります。ここで一番目のサンプルは疾患あり,2番目は疾患なし,3番目は不明ということを表しています。このように置き換えるのがダミー変数ですから,例えばこれを

疾患あり(d1)|疾患なし(d2)|不明(d3)
1 | 2 | 3
2 | 1 | 3
2 | 3 | 1

のようにしてしまったら,ワケが分からなくなってしまいますよね。仮に該当するものには1を割り振ると決めても,他の2変数には何を割り振ったのか区別がつかなくなってしまいます。要するにこのような置き方では計算がメチャクチャになってしまうということです。だから0-1でなければいけないのです。

後半のことについては私もあまり詳しくないので説明できません。

この回答への補足

回答ありがとうございます。なかなか勉強不足で難しく感じます。
結論として、ロジスティックの従属変数は(なし=0、ある=1)

で、独立変数に関しては何でもよいわけですよね?独立変数はある項目Aで(なし=1、ある=2)項目Bで(1=当てはまらない、2=どちらともいえない、3=当てはまる)でよいのでしょうか?
すみません。よくわかっていません。

補足日時:2006/12/12 05:20
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!