質問

卒論で結果を出すために回帰分析というものをやらなくてはいけないらしいのですが、調べてもバリバリ文系の私には難しすぎてさっぱり理解不能です。

どなたか、回帰分析とはいったいどのようなものなのか分かりやすく教えて頂けないでしょうか?

通報する

回答 (12件中1~10件)

>最後にもう一度アドバイスを

テーマとしてはなかなか面白いと思いますし,社会的な意義もある研究ですね。どこかの官庁がやっているかもしれませんが。ただ,当初の質問の趣旨と随分外れているようですから,一度閉めて,再質問をされた方が良いのでは?

この回答へのお礼

今まで私の稚拙な質問に付き合って頂きありがとうございます。

私なりにどうにか回帰分析を理解し、どうにか本日OKをもらいました。

本当にありがというございました!!

質問事項とは,ずれてきていますが,せっかくですので。
>「各都道府県の犬の殺処分率や殺処分頭数と犬の返還数・譲渡数との関係を明らかにする事」

正直,私には意味が分かりません。というのは,普通に考えて
総捕獲数=殺処分頭数+(返還数+譲渡数)ですよね。割合に直せば
殺処分頭数+(返還数+譲渡数)=1
ではないのですか? 

まぁ,指導教官が回帰分析をやれと言っている以上,これ以外の何事かを分析する必要があるのでしょう。推測は付きます。おそらく,相関行列から因子分析をして,都道府県の傾向をグルーピングしろ,という意味でしょう。

ただ,ここまでやるなら,Excelで分析するのは止めた方が良いです。かなりExcelと統計解析に精通していないと,分析ができませんよ。別販売のアドオンソフトを購入するか,SPSS,Rなどきちんとした統計解析ソフトを利用すべきです。

この回答へのお礼

すみません、間違えました。
各都道府県の犬の殺処分率や殺処分頭数

犬の予防注射率や不妊去勢手術率
との関係を明らかにする事
です。

大変厚かましいとは存じますが最後にもう一度アドバイスを頂けませんでしょうか?

#9補足(笑)ね。
あなたがどのような実験(調査)をやったのかが分かれば,もう少し詳しい話もできるのですが,#9の説明はあくまでも説明変数(結果に影響を与える要因)が1つの場合です。

例えば,気温とビヤホールの売り上げ(来客数),なんていう有名な調査があります。気温が上がれば,来客数(ビヤホールの売り上げ)は伸びるのか?,これがつまり相関の有無です。ここまでの結論を出すために,回帰分析を使う馬鹿はいません。

ともかく,単純に気温と来客数をプロットして相関係数を調べればそれで済む。ピアソンでもスピアマンでもやればいい。データ数が少なければスピアマンかケンドールでしょう。「なるほど,気温が上がるほど,来客数は伸びるんだなぁ」と分かります。

知りたいのはその先。「じゃ,今日の予想気温が31度だけど,どのくらい客が来るか,どのくらいビールを仕入れておけばいいか?」ですよね。これを知るための分析が回帰分析です。ここで,来客数(y)と気温(x)の関係が
y=2500+0.3x-93(もちろん式は適当)
だったら,2500人の来客があるわけだから,それくらいのビールを仕入れておこう,という話になるわけです。

(この式ではマイナスは出ませんが,実際にはyがマイナスになる場合もあります。つまり,その気温になったらビヤホールを開いていても売り上げが上がらない,という意味になりますから,いつ店を閉めたら良いかの目安を示すことになります)

ところが,ビヤホールの来客数というのは,単純に気温だけが要因ではありません。湿度や天気(雨か晴か),曜日,給料日直前・直後など,売り上げを左右する要因は他にもあるでしょう。こうした複数の要因をまとめて分析するためには,「重回帰分析」という手法が必要です。マーケティングだと共分散分析かな?

さらに,それぞれの要因がどの程度寄与しているのか,という寄与率の問題も検討する必要があります。

そこで冒頭の話に戻るのです。あなたの実験(調査)が説明変数1つならそれで良いですが,複数の要因があるなら単回帰分析をやっておしまいというわけにはいかないですよ。

この回答へのお礼

さらに詳しい回答ありがとうございます。
私がこれからやるのは、「各都道府県の犬の殺処分率や殺処分頭数と犬の返還数・譲渡数との関係を明らかにする事」です。

もし何かアドバイスを頂けたら助かります。

どうしようかなぁと思ったのですが,若干不正確な説明がされているようなので補足。

○回帰分析とはどのようなものか
回帰分析は直接的には,相関関係を調べるものではありませんよ。その次のステップです。相関だけだったら,相関係数を求めて,p値を確認すれば終わりです。
回帰分析は,その次,結果となる変数の動きが原因となるデータによってどの程度・どのように説明できるかを分析するものです。

事例として,他の方が身長と体重の話を出してくれていますので,それを使います。例えば,大学4年生100人の身長と体重を調べた結果,
1.身長(y)と体重(x)のデータが集まります。
2.このxとyについて,有意な相関が見られるかどうかを調べます。
(ここが,相関を調べるということ)
その方法として,例えば散布図を書くなどの手法がありますが,別に散布図を書かなくたって,相関は調べられますから,必須ではありません。相関係数の求め方とp値の意味については質問から外れますから,書きません。

ここで,相関関係が見られなければ,それでおしまい。回帰分析をする必要なんか,全くありません。やったって意味がない。

相関係数の意味とは,【どの程度の】関係があるか,という強さ(量)です。

3.で,仮に相関関係が有った場合に,【どのような】相関なのかを明らかにするのが,回帰分析の意味です。

分かりますか? 【どの程度の関係】という強さ(量)を調べるのが相関係数,【どのような関係】という質を調べるのが回帰分析,2つは全く違う話です。

具体的には,例えば単回帰式を書きます。

y=a+bx+cというような式ですね。これは,一次関数となり,実際には散布図上の直線になります。先ほどの身長(y)と体重(x)の間に,
y=100+0.7x+20.5という式が出たとしましょう(式は適当です)。

この式の意味は,直接的には「大学4年生の身長と体重の関係は,この式で表現できる」ということです。体重70kgの学生の身長は,式に当てはめることによって169.5cm程度だと予想することができる,ことになります。

つまり,回帰式を書く(回帰分析をする)ことによって,大学4年生の体重から,身長を予想することができるようになるのです。

実際には,この後にF検定をして,この式の妥当性(あてはまりの程度)を調べなければなりません。その際に,R二乗値・等分散性・残差分析などについての知識が無ければ歯が立たないでしょう。

その辺りまで勉強し始めると,卒論には全然間に合わないですから,とりあえずは,回帰分析のやり方だけ覚えて,その辺りは目をつぶったらどうでしょう? 卒論ならそれでも通ると思いますよ。

この回答へのお礼

親身なアドバイス、痛み入ります。

>その辺りまで勉強し始めると,卒論には全然間に合わないですから,とりあえずは,回帰分析のやり方だけ覚えて,その辺りは目をつぶったらどうでしょう? 卒論ならそれでも通ると思いますよ。

もう時間がないのでそうしたいと思います。
ありがとうございました。

No.5つづきです。

回帰分析の「やり方」については、他の方が説明されているので、
回帰分析の「意味」というか、「何に使うか」をちょっと説明しておきますね。

先に高校のクラスの「身長と体重」の例を出しましたが、普通、両者には正比例のような関係があることがわかりますよね。
もう少し正確に言うと「相関関係」というんですが、この相関関係を探るための手法が回帰分析とお考えください。

もっとも、「関係を調べたら右上がりになった」というだけじゃ不十分です。
とうのは、「分布がどの程度右上がりか」という要素の他に、「分布がどの程度密集しているか」と言う要素もあるからです。
つまり、一つ一つの点が密集していれば「相関が強い」ことになるし、けっこうバラバラで、
身長が低いのに体重がある人が多かったり、高いのに軽い人が多かったりすれば「相関が弱い」ことになります。

まあ、身長と体重は相関関係が強いほうなんでしょうが、
たとえば、「学生の偏差値」と「その親の高校時代の偏差値」はどうなんでしょうね。
多少はあるんでしょうが、強い相関なのかどうか・・・。
また、「親の所得」と「子どもの偏差値」なんていうとどうなんでしょうね?あるとも言われてますが、実際調べたらどの程度の相関の強さなのか。
関係がかなり強ければ、所得の低い親を持った子は絶望的な気持ちになるでしょうし、
関係が弱ければ、いちおう右上がりの関係があっても、「例外も多いからねえ」ということで救われますね。

まあ、そういったいろいろな数字の関係を調べるのに使うのが回帰分析だと考えておけばさしあたりは大丈夫だと思います。

>回帰分析とはいったいどのようなものなのか分かりやすく教えて頂けないでしょうか?
 何度か同じような質問に回答しています。計算はエクセルで簡単。

卒論なら、指導教授に訊く
だめなら、その理由を書き、3日待つ
旅先から帰って、理由をかいてあれば、教える。

No.2の回答者です。

3点補足しておきますね。

1.
「回帰」のことを「最小二乗法」とも言います。
(最小自乗法ともいう)
調べ物をするときのキーワードとして覚えておくとよいですよ。
(厳密に言えば違うのですが、世の中で行われている回帰は、ほぼ100%最小二乗法です。)


2.
エクセルにおいてグラフを作るとき、
グラフの種類は、折れ線グラフや棒グラフではなく「散布図」を洗濯します。
これを知らないがために最初戸惑う人が多いので、覚えておくとよいでしょう。


3.
実際の手順やグラフの例が書かれたサイトを見つけましたので、参考にしてください。

エクセルを利用した例 その1
http://szksrv.isc.chubu.ac.jp/lms/lms2.html
エクセルを利用した例 その2
http://homepage1.nifty.com/gfk/sohkan-keisuu.htm

右上に四次関数のグラフに回帰した例があります。
http://ja.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F% …


以上、ご参考になれば幸いです。

この回答へのお礼

エクセルを利用した例のリンクを貼り付けて頂きありがとうございます!

実際に自分でやるときに大いに参考にさせて頂きます。

高校のクラスに男女合わせて30人の生徒がいる。
30人の平均体重を出したら55kgだった。
その場合、身長が180m、体重が65kgの生徒をつかまえて、
「あなた平均を10kgも超えてるから太りすぎ」と言うのは無意味ですね。
身長に応じた平均体重といったものを出す必要がありますから。

で、グラフ用紙に、ヨコ軸に身長、タテ軸に体重をとって、
一人ひとりの値をプロットしていくと、普通は右上がりの分布になりますね。
その分布の真ん中に右上がりの線が引けるような式を見つけるわけです。

大雑把に言えば、それが回帰分析です。

http://gucchi24.hp.infoseek.co.jp/MRA1.htm
このサイトがわかりやすいかも。

この回答へのお礼

わかりやすい例題ありがとうございます!
少しだけ理解できた気がします。

分析自体はエクセルで簡単にできます。数値を選択して,ビスタならタブのデーターの中のデーター分析を選択し,回帰分析を選択します。もしかしたら回帰分析が入っていない事があるので,その時はアドインで追加すれば大丈夫です。

経済学部であれば,高校の数学Cの教科書,新世社の統計学入門が参考書になります。エクセルで出した結果を,参考書と参照しながら学習されれば良いと思います。

この回答へのお礼

詳しい解説をありがとうございます。全部が全部自分でやらなくてもいいのですね!少し救われた気持ちになりました!

#1ですが、補足として変数が2つ(つまりXとYしかない)の場合、一番手っ取り早いのは、Excelで横軸にX、縦軸にYの散布図を描いて近似曲線を引く方法です。(正直これだけやっておけばOKだと思います)

この回答へのお礼

回答ありがとうございます。これから勉強してみます。

このQ&Aは役に立ちましたか?2 件

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

新しく質問する

注目の記事

子供の夏休みの過ごし方

読書感想文・自由研究・宿題・工作など、たまには子供と一緒にチャレンジしてみませんか?

このQ&Aを見た人が検索しているワード


新しく質問する

このカテゴリの人気Q&Aランキング

毎日見よう!教えて!gooトゥディ

べんりQ&A特集