独立変数(複数存在)が、従属変数に対しておよぼす影響の大きさを知りたいのですが、以下のどちらの方法を適用すればよいのでしょうか。つまり、個々の独立変数ごとに従属変数の変動に占める影響割合(%)を知りたいのです。

第一の方法は、重回帰分析を行い、その偏回帰係数を標準化して(つまり、標準偏回帰係数)、その標準偏回帰係数の大きさによって、影響の大きさを比較する。

第二の方法は、分散分析のうち一般線形モデルを使用する方法です。ここで一般線形モデルとは、私が使用している統計ソフトの定義によると、独立変数としてカテゴリーデータと計量データを同時にモデルに含めることができます(ただし、モデルに含める計量データはcovariatesとして指定することになっています)。 この方法でアプローチした場合、従属変数の全変動(つまり平方和)を独立変数ごとに分解するので、その(平方和の)比率で影響の大きさを比較できます。

実際の例(カテゴリーデータと計量データを含む)を使って、上述のふたつの方法で計算してみたところ、異なる値になってしまいました。結局、どちらが正しいのかわかりません。 よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

関係を見るのであれば、重回帰分析でよいのではないでしょうか。



これは、従属変数と、各独立変数との偏相関係数をとることと同じです。

分散分析は、二つのデータの差を検定する時に用います。

参考URL:http://www4.ocn.ne.jp/~murakou/mreg.htm

この回答への補足

コメント有難う御座います。少し補足します。ご存知のように、本来、分散分析はグループ間の平均値を比較する道具です。
したがって、私のアプローチは、本来的な使い方ではないのです。
分散分析表には、従属変数(Y)の全平方和を個々の要因毎の(つまり、主効果毎の)平方和、及びこれらの要因の交互作用毎の平方和、さらにノイズ(エラー)の平方和に分解します。
これら平方和の比率によって、従属変数の変動に対する要因毎の影響度を示すことを考えています。
勿論、分散分析を適用する上での前提条件(各グループは正規分布することや等分散であること)はクリアーした上での話しですが。 私のアプローチは誤りでしょうか? よくわかりません。

補足日時:2005/04/26 02:54
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q従属変数が複数かつ潜在変数である場合の因果検証について

<解析デザイン>
複数の独立変数・媒介変数・調整変数(いずれも観測変数)と、
複数の従属変数(下位尺度得点≒潜在変数?)との因果関係を調べたい。

<疑問点1>
・重回帰分析では潜在変数が使えないとされていますが、以下のURLでは、必ずしも「観測された変数」ではなくても、「観測可能な変数」であれば、実質的には観測変数とみなしてOK、といったニュアンスとも読み取れまして・・・。私の場合、2項目の測定変数の平均値を従属変数としているので、これを観測変数とみなすことの是非を教えていただきたいです。
http://www.aichi-gakuin.ac.jp/~chino/multivar/chapter5/sec5-1.html

<疑問点2>
・従属変数が複数ある場合には重回帰分析は使えず、パス解析や共分散構造分析を用いる(小野寺、2006)とあるのですが、パス解析の説明書きには「潜在変数を扱わない」(山本、2000)とあり、また共分散構造分析は私の実験デザインには適合しないと思われ、では一体何を使えばいいんじゃ!と混乱しております。多変量重回帰分析なるものもあるようですが、疑問点1をクリアしないと、これも使うことはできないでしょう。従属変数が複数ありかつ潜在変数である場合、この因果モデルを検証するには、どの手法を使うことが可能なんでしょうか?

お手数をおかけしますが、どうぞよろしくご教示ください。

<解析デザイン>
複数の独立変数・媒介変数・調整変数(いずれも観測変数)と、
複数の従属変数(下位尺度得点≒潜在変数?)との因果関係を調べたい。

<疑問点1>
・重回帰分析では潜在変数が使えないとされていますが、以下のURLでは、必ずしも「観測された変数」ではなくても、「観測可能な変数」であれば、実質的には観測変数とみなしてOK、といったニュアンスとも読み取れまして・・・。私の場合、2項目の測定変数の平均値を従属変数としているので、これを観測変数とみなすことの是非を教えていただ...続きを読む

Aベストアンサー

> 実質的には観測変数とみなしてOK

どの部分を読んでそう考えたのですか?
流し読みしただけですが、そのようなことは書いていなかったようですが、、、
もし私の見落としで書いてあったとしても、重回帰モデルにおいて、説明変数(独立変数)に潜在変数を使うのは無理でしょう。潜在変数は「データとして手元にない」のですから、どうやって手元にないデータから目的変数(従属変数)を予測するのか、そもそもどうやってパラメータを推定するのか、どう考えてみても難しいでしょう(^_^;)

手元にデータがあるのであれば、それは潜在変数ではありえないし、手元にデータがなければそれが観測変数であるわけもない。と、いうわけです。

> 多変量重回帰分析なるものもあるようですが、

従属変数が潜在変数(つまり実際にはデータとして得られていない情報)というのは多変量重回帰分析の扱える範囲を超えていますから無理ですね。従属変数がない場合(つまり潜在変数を仮定する場合)は因子分析モデルや主成分分析モデルに類似したモデルを考えるしかないでしょう。

過去に同じようなモデルを扱ったことがある例があれば、それを参考にするか、さもなくば自分でパス図を考えて解析するしかないでしょう(共分散構造分析によって、その想定したモデルが上手く解析できるかどうかは別問題ですが)。

> では一体何を使えばいいんじゃ!

要するに、解析することが難しいモデルを作成しないこと(そういう実験計画を立てないようにする)、ということですね。潜在変数を扱うのはかなりの知識と経験が必要となりますから、(察するに大学関係の人のようなので)詳しい先生に助言を仰ぐとよいと思いますよ。

それこそ、参考にしたウェブサイトの千野先生は親切な方だからメールで質問すれば助言を受けられるかもしれません。

> 実質的には観測変数とみなしてOK

どの部分を読んでそう考えたのですか?
流し読みしただけですが、そのようなことは書いていなかったようですが、、、
もし私の見落としで書いてあったとしても、重回帰モデルにおいて、説明変数(独立変数)に潜在変数を使うのは無理でしょう。潜在変数は「データとして手元にない」のですから、どうやって手元にないデータから目的変数(従属変数)を予測するのか、そもそもどうやってパラメータを推定するのか、どう考えてみても難しいでしょう(^_^;)

手元にデータ...続きを読む

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む


人気Q&Aランキング

おすすめ情報