卒論で結果を出すために回帰分析というものをやらなくてはいけないらしいのですが、調べてもバリバリ文系の私には難しすぎてさっぱり理解不能です。

どなたか、回帰分析とはいったいどのようなものなのか分かりやすく教えて頂けないでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (12件中1~10件)

>最後にもう一度アドバイスを



テーマとしてはなかなか面白いと思いますし,社会的な意義もある研究ですね。どこかの官庁がやっているかもしれませんが。ただ,当初の質問の趣旨と随分外れているようですから,一度閉めて,再質問をされた方が良いのでは?
    • good
    • 2
この回答へのお礼

今まで私の稚拙な質問に付き合って頂きありがとうございます。

私なりにどうにか回帰分析を理解し、どうにか本日OKをもらいました。

本当にありがというございました!!

お礼日時:2009/01/31 23:06

質問事項とは,ずれてきていますが,せっかくですので。


>「各都道府県の犬の殺処分率や殺処分頭数と犬の返還数・譲渡数との関係を明らかにする事」

正直,私には意味が分かりません。というのは,普通に考えて
総捕獲数=殺処分頭数+(返還数+譲渡数)ですよね。割合に直せば
殺処分頭数+(返還数+譲渡数)=1
ではないのですか? 

まぁ,指導教官が回帰分析をやれと言っている以上,これ以外の何事かを分析する必要があるのでしょう。推測は付きます。おそらく,相関行列から因子分析をして,都道府県の傾向をグルーピングしろ,という意味でしょう。

ただ,ここまでやるなら,Excelで分析するのは止めた方が良いです。かなりExcelと統計解析に精通していないと,分析ができませんよ。別販売のアドオンソフトを購入するか,SPSS,Rなどきちんとした統計解析ソフトを利用すべきです。
    • good
    • 0
この回答へのお礼

すみません、間違えました。
各都道府県の犬の殺処分率や殺処分頭数

犬の予防注射率や不妊去勢手術率
との関係を明らかにする事
です。

大変厚かましいとは存じますが最後にもう一度アドバイスを頂けませんでしょうか?

お礼日時:2009/01/25 13:17

#9補足(笑)ね。


あなたがどのような実験(調査)をやったのかが分かれば,もう少し詳しい話もできるのですが,#9の説明はあくまでも説明変数(結果に影響を与える要因)が1つの場合です。

例えば,気温とビヤホールの売り上げ(来客数),なんていう有名な調査があります。気温が上がれば,来客数(ビヤホールの売り上げ)は伸びるのか?,これがつまり相関の有無です。ここまでの結論を出すために,回帰分析を使う馬鹿はいません。

ともかく,単純に気温と来客数をプロットして相関係数を調べればそれで済む。ピアソンでもスピアマンでもやればいい。データ数が少なければスピアマンかケンドールでしょう。「なるほど,気温が上がるほど,来客数は伸びるんだなぁ」と分かります。

知りたいのはその先。「じゃ,今日の予想気温が31度だけど,どのくらい客が来るか,どのくらいビールを仕入れておけばいいか?」ですよね。これを知るための分析が回帰分析です。ここで,来客数(y)と気温(x)の関係が
y=2500+0.3x-93(もちろん式は適当)
だったら,2500人の来客があるわけだから,それくらいのビールを仕入れておこう,という話になるわけです。

(この式ではマイナスは出ませんが,実際にはyがマイナスになる場合もあります。つまり,その気温になったらビヤホールを開いていても売り上げが上がらない,という意味になりますから,いつ店を閉めたら良いかの目安を示すことになります)

ところが,ビヤホールの来客数というのは,単純に気温だけが要因ではありません。湿度や天気(雨か晴か),曜日,給料日直前・直後など,売り上げを左右する要因は他にもあるでしょう。こうした複数の要因をまとめて分析するためには,「重回帰分析」という手法が必要です。マーケティングだと共分散分析かな?

さらに,それぞれの要因がどの程度寄与しているのか,という寄与率の問題も検討する必要があります。

そこで冒頭の話に戻るのです。あなたの実験(調査)が説明変数1つならそれで良いですが,複数の要因があるなら単回帰分析をやっておしまいというわけにはいかないですよ。
    • good
    • 0
この回答へのお礼

さらに詳しい回答ありがとうございます。
私がこれからやるのは、「各都道府県の犬の殺処分率や殺処分頭数と犬の返還数・譲渡数との関係を明らかにする事」です。

もし何かアドバイスを頂けたら助かります。

お礼日時:2009/01/24 20:40

どうしようかなぁと思ったのですが,若干不正確な説明がされているようなので補足。



○回帰分析とはどのようなものか
回帰分析は直接的には,相関関係を調べるものではありませんよ。その次のステップです。相関だけだったら,相関係数を求めて,p値を確認すれば終わりです。
回帰分析は,その次,結果となる変数の動きが原因となるデータによってどの程度・どのように説明できるかを分析するものです。

事例として,他の方が身長と体重の話を出してくれていますので,それを使います。例えば,大学4年生100人の身長と体重を調べた結果,
1.身長(y)と体重(x)のデータが集まります。
2.このxとyについて,有意な相関が見られるかどうかを調べます。
(ここが,相関を調べるということ)
その方法として,例えば散布図を書くなどの手法がありますが,別に散布図を書かなくたって,相関は調べられますから,必須ではありません。相関係数の求め方とp値の意味については質問から外れますから,書きません。

ここで,相関関係が見られなければ,それでおしまい。回帰分析をする必要なんか,全くありません。やったって意味がない。

相関係数の意味とは,【どの程度の】関係があるか,という強さ(量)です。

3.で,仮に相関関係が有った場合に,【どのような】相関なのかを明らかにするのが,回帰分析の意味です。

分かりますか? 【どの程度の関係】という強さ(量)を調べるのが相関係数,【どのような関係】という質を調べるのが回帰分析,2つは全く違う話です。

具体的には,例えば単回帰式を書きます。

y=a+bx+cというような式ですね。これは,一次関数となり,実際には散布図上の直線になります。先ほどの身長(y)と体重(x)の間に,
y=100+0.7x+20.5という式が出たとしましょう(式は適当です)。

この式の意味は,直接的には「大学4年生の身長と体重の関係は,この式で表現できる」ということです。体重70kgの学生の身長は,式に当てはめることによって169.5cm程度だと予想することができる,ことになります。

つまり,回帰式を書く(回帰分析をする)ことによって,大学4年生の体重から,身長を予想することができるようになるのです。

実際には,この後にF検定をして,この式の妥当性(あてはまりの程度)を調べなければなりません。その際に,R二乗値・等分散性・残差分析などについての知識が無ければ歯が立たないでしょう。

その辺りまで勉強し始めると,卒論には全然間に合わないですから,とりあえずは,回帰分析のやり方だけ覚えて,その辺りは目をつぶったらどうでしょう? 卒論ならそれでも通ると思いますよ。
    • good
    • 0
この回答へのお礼

親身なアドバイス、痛み入ります。

>その辺りまで勉強し始めると,卒論には全然間に合わないですから,とりあえずは,回帰分析のやり方だけ覚えて,その辺りは目をつぶったらどうでしょう? 卒論ならそれでも通ると思いますよ。

もう時間がないのでそうしたいと思います。
ありがとうございました。

お礼日時:2009/01/24 17:47

No.5つづきです。



回帰分析の「やり方」については、他の方が説明されているので、
回帰分析の「意味」というか、「何に使うか」をちょっと説明しておきますね。

先に高校のクラスの「身長と体重」の例を出しましたが、普通、両者には正比例のような関係があることがわかりますよね。
もう少し正確に言うと「相関関係」というんですが、この相関関係を探るための手法が回帰分析とお考えください。

もっとも、「関係を調べたら右上がりになった」というだけじゃ不十分です。
とうのは、「分布がどの程度右上がりか」という要素の他に、「分布がどの程度密集しているか」と言う要素もあるからです。
つまり、一つ一つの点が密集していれば「相関が強い」ことになるし、けっこうバラバラで、
身長が低いのに体重がある人が多かったり、高いのに軽い人が多かったりすれば「相関が弱い」ことになります。

まあ、身長と体重は相関関係が強いほうなんでしょうが、
たとえば、「学生の偏差値」と「その親の高校時代の偏差値」はどうなんでしょうね。
多少はあるんでしょうが、強い相関なのかどうか・・・。
また、「親の所得」と「子どもの偏差値」なんていうとどうなんでしょうね?あるとも言われてますが、実際調べたらどの程度の相関の強さなのか。
関係がかなり強ければ、所得の低い親を持った子は絶望的な気持ちになるでしょうし、
関係が弱ければ、いちおう右上がりの関係があっても、「例外も多いからねえ」ということで救われますね。

まあ、そういったいろいろな数字の関係を調べるのに使うのが回帰分析だと考えておけばさしあたりは大丈夫だと思います。
    • good
    • 0

>回帰分析とはいったいどのようなものなのか分かりやすく教えて頂けないでしょうか?


 何度か同じような質問に回答しています。計算はエクセルで簡単。

卒論なら、指導教授に訊く
だめなら、その理由を書き、3日待つ
旅先から帰って、理由をかいてあれば、教える。
    • good
    • 1

No.2の回答者です。



3点補足しておきますね。

1.
「回帰」のことを「最小二乗法」とも言います。
(最小自乗法ともいう)
調べ物をするときのキーワードとして覚えておくとよいですよ。
(厳密に言えば違うのですが、世の中で行われている回帰は、ほぼ100%最小二乗法です。)


2.
エクセルにおいてグラフを作るとき、
グラフの種類は、折れ線グラフや棒グラフではなく「散布図」を洗濯します。
これを知らないがために最初戸惑う人が多いので、覚えておくとよいでしょう。


3.
実際の手順やグラフの例が書かれたサイトを見つけましたので、参考にしてください。

エクセルを利用した例 その1
http://szksrv.isc.chubu.ac.jp/lms/lms2.html
エクセルを利用した例 その2
http://homepage1.nifty.com/gfk/sohkan-keisuu.htm

右上に四次関数のグラフに回帰した例があります。
http://ja.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F% …


以上、ご参考になれば幸いです。
    • good
    • 0
この回答へのお礼

エクセルを利用した例のリンクを貼り付けて頂きありがとうございます!

実際に自分でやるときに大いに参考にさせて頂きます。

お礼日時:2009/01/23 22:18

高校のクラスに男女合わせて30人の生徒がいる。


30人の平均体重を出したら55kgだった。
その場合、身長が180m、体重が65kgの生徒をつかまえて、
「あなた平均を10kgも超えてるから太りすぎ」と言うのは無意味ですね。
身長に応じた平均体重といったものを出す必要がありますから。

で、グラフ用紙に、ヨコ軸に身長、タテ軸に体重をとって、
一人ひとりの値をプロットしていくと、普通は右上がりの分布になりますね。
その分布の真ん中に右上がりの線が引けるような式を見つけるわけです。

大雑把に言えば、それが回帰分析です。

http://gucchi24.hp.infoseek.co.jp/MRA1.htm
このサイトがわかりやすいかも。
    • good
    • 0
この回答へのお礼

わかりやすい例題ありがとうございます!
少しだけ理解できた気がします。

お礼日時:2009/01/23 22:17

分析自体はエクセルで簡単にできます。

数値を選択して,ビスタならタブのデーターの中のデーター分析を選択し,回帰分析を選択します。もしかしたら回帰分析が入っていない事があるので,その時はアドインで追加すれば大丈夫です。

経済学部であれば,高校の数学Cの教科書,新世社の統計学入門が参考書になります。エクセルで出した結果を,参考書と参照しながら学習されれば良いと思います。
    • good
    • 0
この回答へのお礼

詳しい解説をありがとうございます。全部が全部自分でやらなくてもいいのですね!少し救われた気持ちになりました!

お礼日時:2009/01/23 14:25

#1ですが、補足として変数が2つ(つまりXとYしかない)の場合、一番手っ取り早いのは、Excelで横軸にX、縦軸にYの散布図を描いて近似曲線を引く方法です。

(正直これだけやっておけばOKだと思います)
    • good
    • 0
この回答へのお礼

回答ありがとうございます。これから勉強してみます。

お礼日時:2009/01/23 14:23

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aと関連する良く見られている質問

Q回帰分析の目的変数が0~1の確率の場合は?

今、集団の中のある割合(具体的には、ある集団の中の外国人の割合)を目的変数にして回帰分析を行っています。
目的変数は0から1の連続変数を取るのですが(割合なので)、この場合用いる回帰分析はロジスティック回帰でよいのでしょうか?

自分が勉強した範囲では、ロジスティック回帰の目的変数は、0 or 1の2項変数を取るので、違うのかなという気がするのですが・・・(でも代わりに何を使ったら良いのかわかりません)。

勉強不足で申し訳ないのですが、どなたかご教授頂けますでしょうか。
宜しくお願いします。

Aベストアンサー

ちょこっと調べてみただけですが、

http://www.rikkyo.ne.jp/~z2002020/stat/presentation/YamOSJ2005.pdf

など参考になるでしょう。割合データを目的変数として扱う例は出会ったことがないので、私も勉強させてもらいましょう。

[割合 従属変数]とか[割合 回帰分析]というキーワード検索でけっこう出てきますが、、、

Q分析について・・・重回帰?数理分析?? >_<

論文で使用する分析について、教えてください!

以下、論文の簡単な説明と現状の問題を書いています.....
長くなります、、しかもかなり分かりづらいです。。
ご容赦くださいm(__)m

私は論文で大学財務を対象とし、分析しています。
こまかい説明は省きますが、「教育費」の推移を考察しています(「教育費」は大学の会計科目から私が独自で定義しています)。

その分析の過程で国立大学の財務を85校全て収集し、統計的な分析も行うこととなりました。
分析では、「教育費の増減」において、「(1)どのような学校種で増減が発生しているのか」ということと「(2)どのような要因によって増減が発生しているのか」という点を分析する必要があります。
「(1)どのような学校種で増減が発生しているのか」というのは、学校種(たとえば、単科大か総合大か、また文系学部を有しているか、など)と、教育費の増減の関係をみるという形です。
「(2)どのような要因によって増減が発生しているのか」というのは、教育費の増減をもたらしている要因(これは、「総支出の増加」と「総支出に対する教育費の割合の増加」の2つです)と、教育費の増減との関係を考えるものです。

当初、(1)と(2)でそれぞれ別に、教育費の増減との重回帰分析を行いました。
ところが、教授から「(1)と(2)の関係を明らかにし、それをもって最終的に教育費との関係を考えるように」と指摘されました。
しかも教授の説明では、(2)の2つの要因から教育費の増減の計算式が(回帰式的にではなく、数理的に)作れるので、それと(1)を関連付けて、教育費の式を考えてみてと言われました。。

その教授が指摘した教育費の計算式は以下の通りです。
D1-D0=(G1-G0)*P0+(P1-P0)*G0+(P1-P0)(G1-G0)
D…教育費
G…総支出
P…教育費の割合
「1」と「0」は、比較をする時期です。

式のうち、一項目は経費そのものが増えたことによる効果、二項目は教育費の割合が増えたことによる効果、三項目は両方による効果です。

私としては、先生が指摘した意味と、この式の意味は分かります(分かっているつもりです(笑))。
ただ、上の式に(1)の要因をどう関わらせるかが全く分かりません!!!!

私は統計も数理的な分析も全くのど素人です。。
(言い訳をさせていただけるのであれば、当初統計的な分析など予定にありませんでした・・教授の気まぐれで、1か月前になって突然やることに・・・泣)
だれか、なにかいい分析手法をご存じの方や、分析の工夫の仕方を思いつく方がいれば、ぜひこのアホな私にご教授いただけませんでしょうか!!

上の文章自体が分かりづらいし、研究の詳細をかけていないので、そもそも質問をハッキリお伝えできていないのは十分承知の上でございますm(__)m
なんとなくのご提案でも十分ありがたいです。。
だれか、私を助けてください(:_;)

よろしくお願いします!!

論文で使用する分析について、教えてください!

以下、論文の簡単な説明と現状の問題を書いています.....
長くなります、、しかもかなり分かりづらいです。。
ご容赦くださいm(__)m

私は論文で大学財務を対象とし、分析しています。
こまかい説明は省きますが、「教育費」の推移を考察しています(「教育費」は大学の会計科目から私が独自で定義しています)。

その分析の過程で国立大学の財務を85校全て収集し、統計的な分析も行うこととなりました。
分析では、「教育費の増減」において、「(1)どのような学...続きを読む

Aベストアンサー

あくまでも私の推測に過ぎませんが、教授先生は、「(1)と(2)の関係を明らかにし~」というご指摘によって、(1)の分析から明らかになったことと、(2)の分析から明らかになったこととを組み合わせることで、何か新しい発見がありますか、ということを問われていらっしゃるのだと思います。現時点では、(1)の分析と(2)の分析はバラバラで、2つの研究をただ並べているだけになってしまっているのではないですか。

教授先生のご期待に応え、研究の幅を広げる方法はいろいろあると思いますが、私からは、次のことを提案させていただきたいと思います。

1.被説明変数を総支出として、(1)と同様の分析を行う((1)および1.から、学部構成による、総支出の伸び、教育費の伸びの差が明らかになります)。
2.総支出の伸びと教育費の伸びに、教授先生が示された関係を適用する(学部構成による、総支出の伸び、および教育費の伸びに加えて、教育費の割合の変化も明らかになる)。
3.2.の結果を考察する。

教授先生の真意に沿った提案かどうかは分かりませんが、既にデータは揃っているでしょうから、分析は簡単に出来ると思います。分析を重ねて行くと、考える楽しみは級数的に増えて行くものです。大いに楽しんで下さい。

あくまでも私の推測に過ぎませんが、教授先生は、「(1)と(2)の関係を明らかにし~」というご指摘によって、(1)の分析から明らかになったことと、(2)の分析から明らかになったこととを組み合わせることで、何か新しい発見がありますか、ということを問われていらっしゃるのだと思います。現時点では、(1)の分析と(2)の分析はバラバラで、2つの研究をただ並べているだけになってしまっているのではないですか。

教授先生のご期待に応え、研究の幅を広げる方法はいろいろあると思いますが、私からは、次のことを提案...続きを読む

Q回帰分析の目的変数と説明変数の組み合わせの例

経済統計学の夏休みの課題で統計局の時系列データを使い、回帰分析をするというのが出たんですが、目的変数と説明変数の組み合わせ方がわかりません。
使うデータは目的変数も説明変数も比率のものを使えということなのですが、どういう風にくみあわせたらいいのかわかりません。
何か良い例があれば、教えてください。
ちなみに目的変数は離婚率か完全失業率を使おうと思っています。

Aベストアンサー

 離婚率を目的変数として、出生率を説明変数にすると、密接な相関が得られるでしょうが、説明は難しい。すなわち、出生率が低くなると、離婚率が上がるような負の相関になります。でも、この関係を説明するのが困難、すなわち、説明変数に成り得ない。「子はカスガイ」なので、子供がいないと離婚する、なんぞは無理でしょう。この関係は、おそらく擬相関。出生率は交絡因子でしょう。
 というのも、出生率よりも、乳児死亡率を説明変数にした方が強い負の相関が得られる。そうすると、「乳児死亡率が低くなると、離婚しやすくなる」ということになるのですが。赤ちゃんが死なないと、ウルサイ、子育てが大変なので離婚に繋がると、反論もできないし。
 出生率は、「少子化担当大臣」なんぞを置いているが、有効な手を打てていない。すなわち、専門家でも困っているので、こんなものを説明変数に使うのは、・・・。

 離婚とか失業とかは、要因が一つではありません。単純であれば、離婚も完全失業も、問題は解決されています。政府が悩む必要も、社会問題になることもありません。離婚理由の第一は、性格の不一致だと記憶しています。これは数値化できないので、分析できません。
 社会的な事象を目的変数に使うと、交絡因子(影響する因子)が多すぎて、専門家でも正解が難しいのです。こんなものを取り上げるのなら、いくらでも突っ込んであげますが。

>何か良い例があれば、教えてください。
これは、課題の回答を教えるのと同等なので、規約違反になります。
 離婚率や失業を目的変数にすると、何故? を考える説明変数を自分で想定しなければなりません。これは繰り返しになりますが、社会問題となっているように解決できていない、すなわち、原因の説明が政府が有能なハズの学者・官僚を東京に集めて取り組んでも困難なのです。
 むしろ、説明変数を考え、これによって影響されそうなもの(=目的変数)を想像する、の順番の方が、考えやすいのでは。

 すなわち、比率という条件に、一人当たりのGNPが該当しますか。経済というのなら、GNPが経済の根本です。GNPを説明変数にすれば、それによって変動するものが説明変数。経済(説明変数)によって強く影響を受けるもの(目的変数)はいくらでもあるので、その関係を探る(相関分析と回帰分析をする)のが、課題のレベルなら考えやすいのでは。

 ちなみに、GNPと無関係のものは少なく、一人当たりの殺人件数、結婚率、炭水化物摂取量、その国の人口くらいなものです。いくらでもあります。社会は、経済次第、ということです。経済学も、「社会にいかに影響しているか」を教えると、経済学に対する興味も湧くでしょうに・・・。
 法学部の学生などには、「先進国と発展途上国で、どちらが犯罪が多いか」と問いかけています。これも、回帰分析で答えを示すことができますが、データを見つけられないと想います。

>やっぱりこれ重回帰分析というんですか!
 なお、単回帰分析さえ、専門家でも誤った解釈が少なくありません。重回帰分析に手を出すのは、早いのでは。さらに、重回帰分析は、多重共線性の問題を常に念頭に置く必要があります。

 離婚率を目的変数として、出生率を説明変数にすると、密接な相関が得られるでしょうが、説明は難しい。すなわち、出生率が低くなると、離婚率が上がるような負の相関になります。でも、この関係を説明するのが困難、すなわち、説明変数に成り得ない。「子はカスガイ」なので、子供がいないと離婚する、なんぞは無理でしょう。この関係は、おそらく擬相関。出生率は交絡因子でしょう。
 というのも、出生率よりも、乳児死亡率を説明変数にした方が強い負の相関が得られる。そうすると、「乳児死亡率が低くなる...続きを読む

Q因子分析の回帰係数とは何を指すのでしょうか?

因子分析の係数って何を指すのでしょうか?

論文を書くにあたって、先行研究を読んでいたところ、

企業の成長率を雇用・賃金・付加価値・売上の成長などをもとに、因子分析、バリマックス法を行っているようなのです。
この際、
These four indicators were specified as the rate of growth (regression
coefficient) divided by the mean value of the dependent variable over a 10-year period, 1986–1995.

とあります。

成長率を表す指標として、
the rate of growth (regression
coefficient)
があげられています。
regression coefficientは、回帰係数と
訳すようですが、

因子分析における回帰係数に該当するものとは何なのでしょうか?

ご教授いただきたくよろしくお願いいたします。

Aベストアンサー

以下のURLを参考にしてみてください。

  http://www006.upp.so-net.ne.jp/dokugaku-club/Study/stbook/ch05.htm

Q重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが

重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でないといった結果が出たなら、Y=aX1+bX7+cX12+dX20という重回帰式を作成し、標準偏回帰係数を算出し、どの説明係数が最も目的変数に影響を与えているのか解析しているのですが、これが正しい方法(進め方)なのでしょうか?

いきなり、YとX1~X20を重回帰分析したのは、どうでしょうか?これはダメなのでしょうか?単回帰分析では相関が有意にでない(他の説明変数の影響のために)けれども、重回帰分析では有意な結果となるような説明変数が無視されるような結果になるように思うのですが、どうでしょうか?
非常に低レベルな話しで申し訳ないのですが、お教え下さい。

重回帰分析のやり方について教えて下さい。ど素人的な質問で恐縮なのですが、重回帰分析は、目的変数(Y)を、説明変数 X1, X2, X3, X4.....X20などに影響されるか否かを検討しますよね。ここで、私がしようとしている統計学的処理と類似した研究の論文などを読んだりとかしていると、YとX1, YとX2, YとX3, YとX4.....YとX20の単回帰分析を各々行い、ここで有意な相関があったものを取り上げて(例えば、X1, X4, X7, X12, X18, X20の6個など)、この6個について、重回帰分析を施行して、ここで、X4, X18は有意でな...続きを読む

Aベストアンサー

心理学のカテゴリーではないと思いますが、お答えします。

単回帰分析を各々行いと言うのは偏微分の考え方と同様、意味のあるものだと考えます。しかしながらどこまでが有意であるかどうかという判定が難しいでしょう。
相関係数を求めて、これを一定レベルを基準に考えてはどうでしょうか。
最後は複数の重回帰分析結果について、相関係数を判定基準にいずれが最も適切かを判断すればいいと思います。

Q回帰分析について

回帰分析では多重共線性の問題がありますが、簡単な例で説明してくれませんか?お願いします。

Aベストアンサー

平均寿命については、医師数と正の相関がります。看護婦数とも、正の相関が有ります。そこで、平均寿命について、医師数と看護婦数とで重回帰分析をしたところ、回帰係数が、医師数はプラス、看護婦数はマイナスになった経験があります。すなわち、医師数は多い方が、看護婦数は少ない方が平均寿命は長い、という結論になるわけです。
 これは、医師数と看護婦数に多重共線性があるからです。すなわち、医師数と看護婦数に強い相関があるからです。

 この場合は、常識的に変だと気付きますが、回帰分析では多くの要因が絡んでいる場合は、留意する必要があります。すなわち、相関分析の成立5要件(9要件という人も)のうち、特異性に問題が有る場合(平均寿命の場合は、医師数や看護婦数だけではなく、摂取タンパク量や、テレビ台数などなど、多くで有意な相関が成立する)は、慎重に判断すべきでしょう。
 多重共線性については、両者の相関係数が0.4以下なら、大丈夫だろう、ということを聞いたことがあります。

Qエクセル(回帰分析)エラー

必要に迫られ、回帰分析を勉強しています。
あるエクセルのデータに回帰分析を実行したところ、
「回帰分析入力範囲に、数値以外のデータがあります」とのエラーがでました。
ところが、データ内には数値しか入っていません(セルの書式は標準です)
回帰分析が実行できるようにしたいのですが、どうしたらよいでしょうか?

Aベストアンサー

この文章だけでは判断がつきませんね。
分析ツールの回帰分析を選択して入力範囲を入れた段階で
MessageBoxでコメントが返ってくるんですよね。
普通は適当な数字を入れてもとりあえず計算してくれますので
コメントはそのまま数字じゃないデータが入っていると思われます。
入力した数字に間違いはありませんか?
例えば別のセルを使って入力したデータそれぞれを

=ISNUMBER(A1)

等で検査しても全てTRUEが返ってきますか?

Q主成分(回帰)分析について

主成分(回帰)分析ではオーバーフィッティングの問題が無いと言われますが、オーバーフィッティングとは、何の事なのですか?教えて下さい。

Aベストアンサー

私の認識では

ある一定期間やある一定範囲(ミクロ)のデータを使って全体的(マクロ)な特徴を捕らえようとするとき

そのミクロな世界の特徴に過剰に合致(フィット)しすぎてマクロな世界の特徴を表すものではなくなってしまうことをオーバーフィッティングと呼びます。

例えば1週間の株価データから1年後の株価を予測するとき、この1週間が右肩上がりだったら1年後の予想は非常に高くなり、あてにならなくなります。
こういう問題のことをオーバーフィッティング問題と呼んだと思います。

Qおしえて!重回帰分析の独立変数(説明変数)

重回帰分析の目的変数が、(A+B+C+D)というものとします。

A~Dは、数量データです。

説明変数にAやBなどが入っていたら、それはダメですか?

説明変数X(Aとか)が目的変数Y(A+B+C+D)の一部の構成要素だったら、Xを使って重回帰分析はやったらダメなのですか?

Aベストアンサー

例えば「一ヶ月の支出(=食費+光熱費)」「食費」「光熱費」という3変量のデータがあったとします。一ヶ月の支出を目的変数として,食費と光熱費を説明変数として回帰分析を行う。すなわち,以下のようなモデルを考えます。

(一ヶ月の支出)=30000+3.28*食費+1.90*光熱費

これは全く問題ありません。ということで答えになりませんか?

Q重回帰分析の見解のしかた

回帰分析のあるデータの見解を自分なりにしてみましたが、未だ分からないことが多々あるので、どのように言葉にすれば良いのかわかりません。

データは、個人収入の関係で以下のようになっています。
左からモデル1、モデル2、モデル3
定数 61020*** 45521*** 18020***
性別ー女性 -13855*** -13798*** -6686*
年齢 -------- 501** 302*
教育レベル -------- 6022*** 5991***
完全雇用 -------- ------- 26266***
町のサイズ ------- ------- 1499*
R squared 0.049 0.233 0.351

* Significant at p< .05
**Significant at p< .01
***Significant at p< .001

モデル1において性別が女性であることと個人収入は密接な関係があるが、値がマイナス値となっているということは、収入に負の働きをもたらしている。要するに、女性であることでの個人収入が低い・・・。
(マイナス値がどのように意味をなすのか、また、値自体の見方がいまいちわかりません。)
モデル3においては女性であることと個人収入の相関は低い。それよりも、教育レベルや、完全雇用であるかどうかが個人収入と密接に関わっている。

R-squaredが0.5にも達していないので表に対する回帰方式の当てはまりは良くない。モデル1においては、独立変数である個人収入が従属変数である性別ー女性であることを予測するのは難しい・・・。


表がずれている可能性があります。見にくいかもしれません。

どのように表/データから言葉におこせばいいのでしょうか?
よろしくお願いします。

回帰分析のあるデータの見解を自分なりにしてみましたが、未だ分からないことが多々あるので、どのように言葉にすれば良いのかわかりません。

データは、個人収入の関係で以下のようになっています。
左からモデル1、モデル2、モデル3
定数 61020*** 45521*** 18020***
性別ー女性 -13855*** -13798*** -6686*
年齢 -------- 501** 302*
教育レベル -------- 6022*** 5991***
完全雇用 -------- ------- 26266***
町のサイズ ------- ------- 1499*
R squared 0.049 0.233 0.35...続きを読む

Aベストアンサー

> (マイナス値がどのように意味をなすのか、また、値自体の見方がいまいちわかりません。)

モデル3の場合で説明すると、性別と年齢以外の独立変数はどういう値をとるのかわかりませんが、
個人収入 = 18020 - 6686 × [性別:男性なら0, 女性なら1] + 302 × [年齢] + 5991 × [教育レベル] + 26266 × [完全雇用] + 1499 × [町のサイズ]
という回帰式を意味しています。
したがって、どのモデルでも[性別-女性]の偏回帰係数がマイナスなので女性の方が個人収入が低いといえます。

> モデル3においては女性であることと個人収入の相関は低い。それよりも、教育レベルや、完全雇用であるかどうかが個人収入と密接に関わっている。

おそらく変数の係数を比較して相関が低い高いといっていると思いますが、これは意味がありません。
比べるなら標準偏回帰係数で比較するか、相関を知りたいのなら偏相関係数を求めましょう。
詳しいところは、参考URLで調べてみてください。

あとは、独立変数と従属変数が逆になっていることを除けば間違っていないと思います。

参考URL:http://kogolab.jp/elearn/icecream/index.html

> (マイナス値がどのように意味をなすのか、また、値自体の見方がいまいちわかりません。)

モデル3の場合で説明すると、性別と年齢以外の独立変数はどういう値をとるのかわかりませんが、
個人収入 = 18020 - 6686 × [性別:男性なら0, 女性なら1] + 302 × [年齢] + 5991 × [教育レベル] + 26266 × [完全雇用] + 1499 × [町のサイズ]
という回帰式を意味しています。
したがって、どのモデルでも[性別-女性]の偏回帰係数がマイナスなので女性の方が個人収入が低いといえます。

> モデル3においては女性...続きを読む


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング