大変お世話になります。
単回帰について教えてください。
単回帰のxに性別を入れてyとの関係をみることはできないのでしょうか?(StatFlexという統計ソフトを使用しています)
具体的には被験者の性別をx、サイトカインの血中濃度をyとして、単回帰を施行したいのですが、データベース型にサイトカインの値と、性別(M or F)を入力しても、統計>多変量解析>2変量統計で進んでいくと、X軸y軸共に選択肢に性別があがってきません。ダミー変数にしてみてもかわりませんでした。
また同様に病期1,2,3,4についても、選択肢に上がってこないのですが、
xには性・カテゴリーなどは使用できないのでしょうか?連続変数でないといけないのでしょうか?
統計不慣れなもので、常識内の質問であったらお許しください。
A 回答 (4件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
> 使用しているソフトでダミー変数としてみても、やはり説明変数の選択肢にあがってきませんでした。
ならば0-1データ行列にして通常の回帰分析を行えばよいのです。先の返信で私があげたHeight, Weight, Sexの例ならば:
Height = {177, 178, 170, 180, 160, 155, 164, 170}
Weight = {80, 77, 70, 75, 50, 60, 66, 49, 69}
Sex = {1, 1, 1, 1, 0, 0, 0, 0, 0}
というような変数を用意してHeightを応答変数、WeightとSexを説明変数とした重回帰を行えば同じことです。
> STATFLEXでのカテゴリカル型の単回帰の手法をご存じであれば、おしえていただけませんでしょうか?
残念ですが、私はSTATFLEXについて知らないので助言できませんね(^_^;)
> また分散分析をした際にはy=a+bxの係数の値をえることは可能でしょうか?
もちろん可能です。例えば、Rでは対比行列の第1列がベースラインとされるので、第1水準が男性、第2水準が女性ならば切片aが男性の平均値、a + bが女性の平均値ということです。
参考URL:
http://homepage2.nifty.com/nandemoarchive/toukei …
http://homepage2.nifty.com/nandemoarchive/GLM/2_ …
ちなみに、No.2さんが説明してくださっている
> 大袈裟に言えば、女性=-1234 男性=3456789 でもよいです。
についてですが、これは数値をラベルとして指定する場合の話で、分散分析モデルとして解析する際には、必ず0-1データで因子のコーディングが行われます。統計ソフトでカテゴリカル型の変数を直接指定できても、内部的には0-1データ行列に変換され、解析されることになります。
なお、どのようなコーディングがなされるかはソフトによって異なりますが、RではMinitabで採用されているものや、SASで採用されているものを指定することができます。
No.3
- 回答日時:
再びお邪魔します。
すみません。
「女性=0、男性=1 でも、女性=-1234 男性=3456789 でも、相関係数は同じ値になります。」
と書きましたが、
グラフにしたとき右上がりの場合は相関係数はプラス、右下がりの場合は相関係数はマイナスとなります。
絶対値は同じです。
失礼しました。
No.2
- 回答日時:
こんばんは。
できますよ。
多くのパソコンにインストールされているエクセルを使っても、超簡単にできます。
女性=0、男性=1 でもよいし、大袈裟に言えば、女性=-1234 男性=3456789 でもよいです。
(女性=-1、男性=+1 とするのが‘美しい’かもしれません。)
しかしながら、
がんばって回帰したところで、女性の濃度の平均と男性の濃度の平均とを比較することと変わりませんよ。
回帰をする意味があるとすれば、相関係数を求めることです。
私も仕事で、その手法は使いました。非常に有効でした。
女性=0、男性=1 でも、女性=-1234 男性=3456789 でも、相関係数は同じ値になります。
相関係数の絶対値が1に近いほど強い相関、0に近いほど弱い相関となります。
ご参考になりましたら幸いです。
No.1
- 回答日時:
できます。
性別というのはダミー変数といって0と1で表現することができます。男性=1、女性=0といったように。
要するに、
x = {Male, Male, Female, Male, Female, Male}
というデータは、
x' = {1, 1, 0, 1, 0, 1, 0}
と置き換えることができるのですね。これを説明変数として指定すれば、おそらく、どの統計ソフトでも計算してくれるでしょう(してくれないのだとしたら、あまりそういうモノは使わないほうがよいかも・・・)。
ちなみにですが、こういうデータのことをカテゴリカルデータといいますが、説明変数には連続データ(いわゆる数量的なデータといわれるもの)でも、カテゴリカルデータでも、はたまた両方を混在させることもできます。
身長 = 体重 (説明変数が連続型のみ: 単回帰分析)
身長 = 性別 (説明変数がカテゴリカル型のみ: 分散分析)
身長 = 体重 + 性別 (連続型とカテゴリカル型が混在: 共分散分析)
つまり、あなたがしている(しようとしている)ことは分散分析のことなのです。ダミー変数を用いた回帰分析と呼ぶ人もいますが、同じものです。
分かりやすいご説明いただきましてありがとうございます。
説明変数がカテゴリカル型でも可能であるということがわかりました。
ただ使用しているソフトでダミー変数としてみても、やはり説明変数の選択肢にあがってきませんでした。
ソフトの使い方がうまくできていないのかもしれません。
STATFLEXでのカテゴリカル型の単回帰の手法をご存じであれば、おしえていただけませんでしょうか?
また分散分析をした際にはy=a+bxの係数の値をえることは可能でしょうか?ご教授お願い致します。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 t統計量とF統計量について 9 2023/01/05 14:23
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 統計学 どの統計を使えばいいのか教えてください(EZ-Rを使用) 5 2022/10/11 13:28
- 中途・キャリア さて、社会人になってから13年目。 今まで、機械設計、機械製品の品質管理、部門の経営企画をやってきま 4 2023/07/17 08:59
- 統計学 【統計 回帰分析 ダミー変数について】回帰分析に曜日みたいなダミー変数を設定する場合って、ダミー変数 1 2023/01/14 17:00
- 統計学 学業成績に関する重回帰分析の見方について 4 2022/06/06 17:19
- 統計学 混合効果モデルについて 3 2022/05/31 21:00
- 統計学 マルチレベル分析について 2 2023/02/21 09:36
- 大学・短大 大学 統計学 2 2022/09/18 15:06
- 統計学 アンケート調査のデータ比較をする際の統計分析方法の選択に迷っています 5 2022/04/15 01:05
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
エクセルでのシグモイドのカー...
-
単変量解析から多変量解析時の...
-
確率・重回帰分析
-
回帰分析です
-
ロジスティック回帰分析のモデ...
-
回帰分析の論文の書き方につい...
-
回帰分析って何ですか?
-
判別分析やってます。 説明変数...
-
課題で、ワードで2枚程度という...
-
大学の課題の提出に3分遅れてし...
-
経済学のレポートで扱いやすい論題
-
単位を懸けた重要なレポートの...
-
大学の課題がめちゃくちゃ多い...
-
事務の論文について
-
一般的に、遅れた課題をメール...
-
昇進論文のを書かないといけな...
-
レポート用紙に3から4枚書け、...
-
大学生です。自己剽窃について...
-
大学のレポートとか課題って生...
-
レポートの指定字数について
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
エクセルでのシグモイドのカー...
-
2変数のばらつき具合をはかる方...
-
単変量解析から多変量解析時の...
-
回帰分析って何ですか?
-
単回帰分析の結果(説明)の書き方
-
回帰分析で「有意な相関がある...
-
Excel 分析ツールの回帰分析の...
-
EXCELの分析ツールの標準残差とは
-
【統計 回帰分析 ダミー変数に...
-
ダミー変数だけによる重回帰分析
-
回帰分析の論文の書き方につい...
-
EXCELで線形自己回帰分析どこま...
-
SPSS17で二項ロジスティック回...
-
エクセルでの重回帰分析
-
ダミー変数について
-
エクセル統計での単変量解析の仕方
-
重相関係数R2と有意F値(p値)に...
-
ダミー変数の中心化について
-
【統計】テストの弁別力について
-
2変量の単調増加性の検定について
おすすめ情報