「みんな教えて! 選手権!!」開催のお知らせ

はじめまして、統計学初心者です。
ロジスティック回帰分析を、健康状態(良い悪いの0,1)と飲酒日数、たばこ喫煙本数の関係を調べるために行った例をみていて、いくつか疑問があるのでお聞きします。

(分析結果の画像を添付しました。こちらのサイトからお借りしました https://istat.co.jp/ta_commentary/logistic

①「説明変数の目的変数への影響度の大きさは、標準回帰係数とwald統計量でみられる」とあるのですが、当たり前ですがそれぞれ値が違い、同じ目的なのに2つ出す意味があるのか分かりません。
標準回帰係数は説明変数の次元と単位の違いを解消したものだということはぼんやり理解しているので、それだけでいいのではと思ってしまうのですが…

②こちらの表の回帰係数は、健康状態とそれぞれの項目との関係を表しているのですよね?
そもそも、標準回帰係数が算出されているなら、この回帰係数は意味をもたない(表になくてもいい)と思うのですが、一応分析結果としてのせているだけなのでしょうか?

よろしくお願いいたします。

「ロジスティック回帰分析におけるwald統」の質問画像

A 回答 (1件)

リンク先の説明は、各計算量の説明をしていないので、まったく要領を得ず不親切だと思います。

もっときちんとしたサイトなり説明書を見た方がよいのではありませんか?

>①「説明変数の目的変数への影響度の大きさは、標準回帰係数とwald統計量でみられる」とあるのですが、当たり前ですがそれぞれ値が違い、同じ目的なのに2つ出す意味があるのか分かりません。

各「計算量」にはそれぞれの意味があるので、その意味に即して使用する必要があると思います。「同じようなもの」であっても、意味が異なれば使い方も異なりますから。

・標準回帰係数:「標準偏差の何倍」という単位で表わした回帰係数、従ってその変数が「標準偏差」分だけ変化したときの目的変数の変化分。
 例の場合で言えば、「飲酒日数」と「タバコ本数」ではそもそも単位が違うので、「回帰係数」を見ただけではその影響度合いは判断できません(飲酒日数1日当たり、たばこ1本あたりの影響度とういうことですから)。それを一種の「同じ単位で見る」「標準化して見る」としたのが「標準回帰係数」でしょう。

・wald統計量:モデルが正しいとしたときのカイ二乗値。これから「P値」を計算し、P値が大きいほどよい。説明変数の絞り込みに使うもが主な目的。

>②こちらの表の回帰係数は、健康状態とそれぞれの項目との関係を表しているのですよね?
そもそも、標準回帰係数が算出されているなら、この回帰係数は意味をもたない(表になくてもいい)と思うのですが、一応分析結果としてのせているだけなのでしょうか?

 上に書いたように、なんか要領を得ないサイトで、何をどう説明しようとしているのか全く分からないので、何とも答えようがありません。
 ホントに、この表で何を説明しようとしているのでしょうね?
    • good
    • 0
この回答へのお礼

ご回答ありがとうございます。
分かりやすいと思ってみていたサイトですが、説明の端折っているところが多いせいで余計にわからなくなっているのですね・・
早く理解しなくてはと焦って近道をしようとしていましたが、良い本を探すなどしてもう少し基本に立ち戻って勉強したいと思います。

お礼日時:2016/08/08 12:37

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報