【先着1,000名様!】1,000円分をプレゼント!

被説明変数は連続変数、説明変数はすべてダミー変数、という重回帰分析を行う際に何か注意することはあるのでしょうか。あるいはこうした場合は単純な重回帰分析は使うべきでないのでしょうか。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

解釈の問題があるでしょうね。

「ダミー変数を用いた回帰分析」というのは、要するに分散分析のことです。

分散分析表の見方は、教科書で古典的な統計的仮説検定として紹介されているものと同じですが、係数表の見方は慣れないと分かりにくいかもしれません。
    • good
    • 0
この回答へのお礼

ありがとうございました。大変参考になりました。

お礼日時:2009/09/06 17:07

ダミー変数というのは「質的変数」の意味で使ってみえますか。


たとえば、20~29才は2にしたとか。

目的変数が量的で、説明変数が質的の場合、
数量化I類という方法があります。
重回帰分析と似ていますが、統計的有意性判定など作法が少し違います。
    • good
    • 1
この回答へのお礼

ありがとうございました。大変参考になりました。

お礼日時:2009/09/06 17:07

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q修正済み決定係数(R2乗)がマイナスです

修正済みの決定係数がマイナスになりました。

まあ、その回帰モデルが無意味であるのは間違いないのですが、
マイナスになるのはどうしてなのか疑問に思ったので、
ご存知の方がいたら教えてください

Aベストアンサー

こんにちは。

最初に確認なのですが、
重回帰分析のことですよね?

ワタシもただいま勉強中で、
あまり詳しいことは分からないのですが、
多重共線性のあるデータで,偏回帰係数(標準化偏回帰係数)と相関係数の符号が一致しないような場合には,ある変数の寄与率がマイナスになってしまう(別の変数の寄与率が1を越える)こともあるそうです。

説明変数同士で散布図を作成してみて、
多重共線性のあるデータがないか確認してみて下さい。

Q回帰分析の時に対数をとる意味は?

現在、計量経済学の授業で、
回帰分析、最小二乗法について勉強しているのですが、
たまに先生がデータの対数をとって回帰分析をするのですが、
どうして対数をとるのかよくわからないんです。

一応、弾力性を一定とする時や、非線形の関数を
線形にする時に使うらしいことまでは、
わかっているのですが
(でも、それすら怪しいです。間違っていたら訂正してください…)

どうして、対数をとるとそのようなことができるのか
よくわからないんです。

ご存知の方がいらっしゃれば、アドバイスお願いします。
参考書籍・参考サイト等の紹介でもかまいません。

Aベストアンサー

追加の質問の件ですが,ある回帰式について,その説明変数でよいか,その関数形でよいか,ということを統計的に検証する手続きは,特定化の検定(specification test)として確立しています。

よく用いられる例が,Hausman検定やRamseyのRESET検定です。両者は,対立仮説などが異なるので,何を目的とするかで一長一短があり使い分けられます。

ただし,そうした検定はそれなりに難しい(大標本の検定なので,確率極限 plim の概念が必要)ので,学部の4単位くらいの内容ではそこまで至らないでしょう。学部の上級講義か,大学院の修士課程で学ぶ内容ですね。ちゃんとした教科書でも,かなり後の方に説明してある検定です。

ただ,対数をとったモデルと,とらないモデル,どちらの方が望ましいかというだけだったら,上の一般的な定式化の検定よりもずっと簡単な問題で,より簡単なBox-Cox変換で十分です。これだと,入門的な教科書でも手短かに書いてあるでしょう。

なお,その先生の説明を直接聞いたわけではないですが,「対数をとれば,どんな非線形の関係でも,線形回帰式として推定できる」と思われたのなら,誤解を招く説明ですね。

実際,対数をとるだけでは線形にならないような非線形の関係を推定する手法として,非線形最小2乗法とか一般化モーメント法(GMM)とかが用いられているんですからね。これらも,中級以上の教科書なら説明があるでしょう。

追加の質問の件ですが,ある回帰式について,その説明変数でよいか,その関数形でよいか,ということを統計的に検証する手続きは,特定化の検定(specification test)として確立しています。

よく用いられる例が,Hausman検定やRamseyのRESET検定です。両者は,対立仮説などが異なるので,何を目的とするかで一長一短があり使い分けられます。

ただし,そうした検定はそれなりに難しい(大標本の検定なので,確率極限 plim の概念が必要)ので,学部の4単位くらいの内容ではそこまで至らないでしょう。学部の...続きを読む

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Q単回帰分析の結果(説明)の書き方

単回帰分析を行うと、次のような結果が出ました。

r = 0.93, 自由度4, 5%有意水準 (0.811)より有意(1%有意水準 (0.917)でも有意)
ta = -2.71, 自由度4,  5%有意水準 (2.776)より有意ではない
tb = 5.13, 自由度4,  5%有意水準 (2.776)より有意(1%有意水準 (4.604)でも有意)

上記のような結果が出た場合

(1)
ta(t値の切片)は、5%有意水準よりも小さいため、有意ではありませんでした。
5%有意水準で有意でなければ、次に10%有意水準を調べて表示して書いたほうが良いでしょうか?

(2)
rは、xとyの間に因果関係のある非常に高い正の相関関係がある。
rとtb(t値のx値)は、1%有意水準で有意である。
ta(t値の切片)は、5%有意水準でも有意ではない。
このような場合、どのようにして文章に書けば良いのでしょうか?

よろしくお願いします。

Aベストアンサー

多分、ですけど。

r:決定係数(とはいえ決定係数の有意水準?)
ta:aの推定値
tb:bの推定値

ではありませんか。
もしそうであれば、
1.このモデルはyの変動を高い精度でトレースしている
2.aに関しては5%水準で有意ではないが、bに関しては有意である。したがって、原点を通る直線のモデルが支持される(切片がゼロではないとはいえない)
という二点を軸にするとよろしかろうと思います。


> 5%有意水準で有意でなければ、次に10%有意水準を調べて表示して書いたほうが良いでしょうか?

好みの問題です。もしaの推定値がゼロではないと主張したいのであれば当然行う必要がありますが、そうでなければ必ずしも必要ではありません。

Q重回帰のダミー変数について

重回帰分析で,少々悩んでおります。お詳しい方,どなたかご教示下さい。

200人ほどのデータ(職業,年収等)があり,職業が被説明変数に対し,影響を持つのかを重回帰分析を用いて説明しようとしています。職業は10ほどのカテゴリに分け,それぞれダミー変数として説明変数に加えています。
ただ,どうしても分けられない職業が30ほどあり,「その他」として分類しています。この「その他」という職業カテゴリも,ダミー変数として説明変数に入れるべきですか?入れた場合,この変数が有意であった場合どのように解釈すれば良いでしょうか。

大変困っております。どうかお詳しい方ご教示下さい。

Aベストアンサー

職業が「社長」と「その他」しかなかったら、「その他」は捨てるか?

QSPSSと標準偏回帰係数

SPSSの重回帰分析で悩んでいます。解る方がいたら教えてください。データから、従属変数を決定し、独立変数も決定しましたが、標準偏回帰係数の求め方が解りません。違った表現なのかもしれませんが、知識が明るくないので解りません。また、その操作法も教えていただければありがたいです。お願いします。

Aベストアンサー

 心理学系の院生です。

 まず、従属変数、独立変数が決定しているということで、重回帰分析を実施する前に決めるべきことは、あとは変数の投入法だけです。
 変数の投入法に関しては、もしパス解析をやる予定でしたら「強制投入法」という方法を使わなくてはなりませんが、そういう予定がないのでしたら「ステップワイズ法」というのを使えばいいと思います。この方法は、簡単に説明すると、変数を投入しながら重回帰式の有意性の検定をし、有意ではなくなる前の段階で変数の投入を終了するという方法です。

 従属変数・独立変数・変数の投入法が決定したら、重回帰分析を実施します(「OK」ボタンを押すだけです。細かいオプションなどは、設定する必要はないと思います)。すると、別のウィンドウの出力結果が出てくると思いますが、上から順に説明します。

1.一番上
 表のタイトルが、「投入済み変数または除去された変数」となっていると思います。
 この表で、「投入された変数」というのが、実際に重回帰分析で使われた変数になります。

2.上から2番目
 表のタイトルが、「モデル集計」となっていると思います。
 見るべきところは、まず「R2乗」と書いてあるところです。別名「重決定係数」とも言いますが、この重回帰式で従属変数を説明できる割合を示しています。例えば、重決定係数の値が0.35でしたら、35%説明出来ると考えて下さい。ホントはある程度高くないといけないのですが、心理学の場合、いろいろな理由でかなり低くても問題ありません(あるかも^^;)。

3.上から3番目
 表のタイトルが、「分散分析」となっていると思います。
 ここは、ステップワイズ法で変数を投入している場合、必ずF値は有意になっていますので、特に見る必要はないと思います。

4.上から4番目
 表のタイトルが、「係数」となっていると思います。
 ここで、標準偏回帰係数がでてきます。見るべきところは「標準化係数|ベータ」と書いてあるところです。ここの値が、その変数の標準偏回帰係数になっています。なお、その隣にt値の有意性の検定が行ってありますので、もし有意でない変数が入っていたら、のぞいて分析を行った方がいいかもしれません。

5.上から5番目
 表のタイトルが、「除外された変数」となっていると思います。
 そのままです。除外された変数が一覧に示してあります。


 なお、重回帰分析を報告する場合に記載する必要があるのは、重決定係数(もしくは、重相関係数:R)、標準偏回帰係数(有意水準も含めて)です。

 心理学系の院生です。

 まず、従属変数、独立変数が決定しているということで、重回帰分析を実施する前に決めるべきことは、あとは変数の投入法だけです。
 変数の投入法に関しては、もしパス解析をやる予定でしたら「強制投入法」という方法を使わなくてはなりませんが、そういう予定がないのでしたら「ステップワイズ法」というのを使えばいいと思います。この方法は、簡単に説明すると、変数を投入しながら重回帰式の有意性の検定をし、有意ではなくなる前の段階で変数の投入を終了するという方法です...続きを読む

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

QP値とZ値の関係を教えてください。z値が2.8SD以上の場合はp値0.

P値とZ値の関係を教えてください。z値が2.8SD以上の場合はp値0.005と同様だということを聞いたのですがどのような計算でこの関係が求められるのかご存知の方がいれば教えてください。

Aベストアンサー

正規分布表をご覧になれば分かります。
P(0≦z≦2.8)=0.4974
ですから、両側で
1-2*0.4974=0.0052
となります。

現在では、正規分布表など使わずともエクセルなどで計算して
くれますが、意味をきちんと理解して使いましょう。

http://www.geisya.or.jp/~mwm48961/statistics/stddiv1.htm

Q重回帰と偏相関の違い

重回帰分析も偏相関分析もともに、複数の説明変数と1つの従属変数が登場人物となって、その関係を分析するものと認識しています。

が、大きな違いとして、重回帰は多重共線性を示す説明変数を同時投入した分析はできないのに対し、偏相関分析は寧ろそういう変数たちを同時に取り扱って分析することに使うと聞きました。

どういう理由で、両者にこのような違いがあるのか、ご教示頂けないでしょうか。

Aベストアンサー

なかなか回答がないので私から,
私は,企業の品質管理の部門に在籍し,SQCを推進する立場にあります.
応用統計で学位を取っています.

重回帰分析は説明変数で目的変数(こちらは従属)を説明することに用いられますが,
相関分析や偏相関分析は,回帰分析や因果分析をやるまえに,
変数間の関係を見るために行われます.

相関係数と偏相関係数の違いは分かりますか?
相関係数行列の逆行列をとったのもが偏相関係数行列になります.
偏相関は,擬相関を取り除いた関係を示しており,「真の関係」と言えます.

今,小学生(例えば1~6年各30名くらいずつ)のデータがあるとします.
データは各人について
学年,靴のサイズ,覚えている漢字数の3変数とします.
このとき,覚えている漢字数を目的変数として,重回帰分析を行いなさい
という問題があったとします.

学年が決まれば,おおよそ靴のサイズと,覚えている漢字数が決まります.
でも,靴のサイズと覚えている漢字数には擬相関があり,
重回帰分析を行うと,学年と,靴のサイズに多重共線性の問題が発生します.

偏相関分析を行うと,靴のサイズと覚えている漢字数の関係が消えますので,
覚えている漢字数は,学年を説明変数として回帰式が立てられることが分かります.

偏相関係数をもっと積極的に使ったモデル化手法として
「グラフィカル・モデリング」があります.

ただ,注意が必要です.統計は万能ではありません.
今,粗暴犯の収監者と一般人が,子供の頃にマクドナルドのような
ジャンクフードをどれだけ食べていたかというデータがあったとします.
このデータから,小さい頃にマクドナルドを食べると
キレやすくなるという回帰分析の結果が得られます.

このときは,偏相関分析を行って擬相関を取り除こうにもデータは
ほかにありません.では,この結論は「真」なのでしょうか?

実は,観測していないデータに「貧困度合い」というのがあるのです.
貧困家庭は,親が共働きして子供に外食をさせていたということです.
むしろ,貧困による劣等感や遊び仲間が影響していると思われます.

話が逸れてしまいましたが,

多くの変数を取り上げ,多重共線性で悩む前に
とりあえずは,本当は関係の無い擬相関を取り除こう,というのが偏相関分析.
ただ,万能ではなく,観測変数として重要なものを上げることを
忘れていれば,お手上げ,
ということです.

データ解析の前に,しっかり仮説を検討して,どのようなデータを採取するか
十分検討することが必要です.

なかなか回答がないので私から,
私は,企業の品質管理の部門に在籍し,SQCを推進する立場にあります.
応用統計で学位を取っています.

重回帰分析は説明変数で目的変数(こちらは従属)を説明することに用いられますが,
相関分析や偏相関分析は,回帰分析や因果分析をやるまえに,
変数間の関係を見るために行われます.

相関係数と偏相関係数の違いは分かりますか?
相関係数行列の逆行列をとったのもが偏相関係数行列になります.
偏相関は,擬相関を取り除いた関係を示しており,「真の関係」と言えます.
...続きを読む

Q対数変換する意味?

私は数学が苦手な文系大学生です。最近「地域分析」という本を読んでいるのですが、たびたび数式を「対数変換すると・・・」と言う風に話が進みます。対数変換をすることの意味がわからないので内容が理解できません。

まず、対数変換とは何なのか?対数変換を行なうと何がどのように変わるのでしょうか?
また、一般的に対数変換とはどのような目的で行なわれるのでしょうか?

ということを文系の学生にわかりやすく教えていただけないでしょうか。
対数変換の内容を理解していないため、質問が的を得ていないかもしれませんが、よろしくお願いします。(また、ここで説明できるような内容でなければ、その旨をお伝えください。)

Aベストアンサー

まず、ここで論じられている「対数」が「常用対数」を意味する
ことを前提として話を進めましょう。

対数に変換するということは、ある数値を
任意の底の値の指数値で表すことを意味します。
具体的に言うと(ここでは常用対数に限定することにしたので)、
ある数値が10(これが常用対数の底の値)の何乗であるのか
ということです。

たとえば、100という数値の常用対数を取ると、
100は10の2乗ですから、「2」となります。
同様に1000は「3」、10000は「4」です。

このように表現すると、正の数値で1以下の小数から
万や億などの非常に大きい値に散らばる数値サンプルを
整理したり表現するのに非常に便利です。

また、対数にしてグラフを作ると、上記のように非常に
大きな数(または0.00000・・・・のように非常に小さい数)
を限られた紙面上でプロットする事ができます。
もしそのプロットした結果が直線になった場合、
その直線の傾きでサンプルの近似式を導き出すこともできます。

具体的例を挙げると、身近なものではpH値。
これはある液体の単位量あたりどのくらい水素イオンが
含まれるかを対数表現したものです。
(厳密には、モル濃度で表した水素イオン濃度の逆数の常用対数)

まとめると、対数は小数から数万・億などの広範囲に散らばる
数値を整理するために使われる道具とお考えになられたら
良いと思います。

まず、ここで論じられている「対数」が「常用対数」を意味する
ことを前提として話を進めましょう。

対数に変換するということは、ある数値を
任意の底の値の指数値で表すことを意味します。
具体的に言うと(ここでは常用対数に限定することにしたので)、
ある数値が10(これが常用対数の底の値)の何乗であるのか
ということです。

たとえば、100という数値の常用対数を取ると、
100は10の2乗ですから、「2」となります。
同様に1000は「3」、10000は「4」です。

この...続きを読む


人気Q&Aランキング