「夫を成功」へ導く妻の秘訣 座談会

卒論で結果を出すために回帰分析というものをやらなくてはいけないらしいのですが、調べてもバリバリ文系の私には難しすぎてさっぱり理解不能です。

どなたか、回帰分析とはいったいどのようなものなのか分かりやすく教えて頂けないでしょうか?

このQ&Aに関連する最新のQ&A

A 回答 (12件中1~10件)

>最後にもう一度アドバイスを



テーマとしてはなかなか面白いと思いますし,社会的な意義もある研究ですね。どこかの官庁がやっているかもしれませんが。ただ,当初の質問の趣旨と随分外れているようですから,一度閉めて,再質問をされた方が良いのでは?
    • good
    • 2
この回答へのお礼

今まで私の稚拙な質問に付き合って頂きありがとうございます。

私なりにどうにか回帰分析を理解し、どうにか本日OKをもらいました。

本当にありがというございました!!

お礼日時:2009/01/31 23:06

質問事項とは,ずれてきていますが,せっかくですので。


>「各都道府県の犬の殺処分率や殺処分頭数と犬の返還数・譲渡数との関係を明らかにする事」

正直,私には意味が分かりません。というのは,普通に考えて
総捕獲数=殺処分頭数+(返還数+譲渡数)ですよね。割合に直せば
殺処分頭数+(返還数+譲渡数)=1
ではないのですか? 

まぁ,指導教官が回帰分析をやれと言っている以上,これ以外の何事かを分析する必要があるのでしょう。推測は付きます。おそらく,相関行列から因子分析をして,都道府県の傾向をグルーピングしろ,という意味でしょう。

ただ,ここまでやるなら,Excelで分析するのは止めた方が良いです。かなりExcelと統計解析に精通していないと,分析ができませんよ。別販売のアドオンソフトを購入するか,SPSS,Rなどきちんとした統計解析ソフトを利用すべきです。
    • good
    • 0
この回答へのお礼

すみません、間違えました。
各都道府県の犬の殺処分率や殺処分頭数

犬の予防注射率や不妊去勢手術率
との関係を明らかにする事
です。

大変厚かましいとは存じますが最後にもう一度アドバイスを頂けませんでしょうか?

お礼日時:2009/01/25 13:17

#9補足(笑)ね。


あなたがどのような実験(調査)をやったのかが分かれば,もう少し詳しい話もできるのですが,#9の説明はあくまでも説明変数(結果に影響を与える要因)が1つの場合です。

例えば,気温とビヤホールの売り上げ(来客数),なんていう有名な調査があります。気温が上がれば,来客数(ビヤホールの売り上げ)は伸びるのか?,これがつまり相関の有無です。ここまでの結論を出すために,回帰分析を使う馬鹿はいません。

ともかく,単純に気温と来客数をプロットして相関係数を調べればそれで済む。ピアソンでもスピアマンでもやればいい。データ数が少なければスピアマンかケンドールでしょう。「なるほど,気温が上がるほど,来客数は伸びるんだなぁ」と分かります。

知りたいのはその先。「じゃ,今日の予想気温が31度だけど,どのくらい客が来るか,どのくらいビールを仕入れておけばいいか?」ですよね。これを知るための分析が回帰分析です。ここで,来客数(y)と気温(x)の関係が
y=2500+0.3x-93(もちろん式は適当)
だったら,2500人の来客があるわけだから,それくらいのビールを仕入れておこう,という話になるわけです。

(この式ではマイナスは出ませんが,実際にはyがマイナスになる場合もあります。つまり,その気温になったらビヤホールを開いていても売り上げが上がらない,という意味になりますから,いつ店を閉めたら良いかの目安を示すことになります)

ところが,ビヤホールの来客数というのは,単純に気温だけが要因ではありません。湿度や天気(雨か晴か),曜日,給料日直前・直後など,売り上げを左右する要因は他にもあるでしょう。こうした複数の要因をまとめて分析するためには,「重回帰分析」という手法が必要です。マーケティングだと共分散分析かな?

さらに,それぞれの要因がどの程度寄与しているのか,という寄与率の問題も検討する必要があります。

そこで冒頭の話に戻るのです。あなたの実験(調査)が説明変数1つならそれで良いですが,複数の要因があるなら単回帰分析をやっておしまいというわけにはいかないですよ。
    • good
    • 0
この回答へのお礼

さらに詳しい回答ありがとうございます。
私がこれからやるのは、「各都道府県の犬の殺処分率や殺処分頭数と犬の返還数・譲渡数との関係を明らかにする事」です。

もし何かアドバイスを頂けたら助かります。

お礼日時:2009/01/24 20:40

どうしようかなぁと思ったのですが,若干不正確な説明がされているようなので補足。



○回帰分析とはどのようなものか
回帰分析は直接的には,相関関係を調べるものではありませんよ。その次のステップです。相関だけだったら,相関係数を求めて,p値を確認すれば終わりです。
回帰分析は,その次,結果となる変数の動きが原因となるデータによってどの程度・どのように説明できるかを分析するものです。

事例として,他の方が身長と体重の話を出してくれていますので,それを使います。例えば,大学4年生100人の身長と体重を調べた結果,
1.身長(y)と体重(x)のデータが集まります。
2.このxとyについて,有意な相関が見られるかどうかを調べます。
(ここが,相関を調べるということ)
その方法として,例えば散布図を書くなどの手法がありますが,別に散布図を書かなくたって,相関は調べられますから,必須ではありません。相関係数の求め方とp値の意味については質問から外れますから,書きません。

ここで,相関関係が見られなければ,それでおしまい。回帰分析をする必要なんか,全くありません。やったって意味がない。

相関係数の意味とは,【どの程度の】関係があるか,という強さ(量)です。

3.で,仮に相関関係が有った場合に,【どのような】相関なのかを明らかにするのが,回帰分析の意味です。

分かりますか? 【どの程度の関係】という強さ(量)を調べるのが相関係数,【どのような関係】という質を調べるのが回帰分析,2つは全く違う話です。

具体的には,例えば単回帰式を書きます。

y=a+bx+cというような式ですね。これは,一次関数となり,実際には散布図上の直線になります。先ほどの身長(y)と体重(x)の間に,
y=100+0.7x+20.5という式が出たとしましょう(式は適当です)。

この式の意味は,直接的には「大学4年生の身長と体重の関係は,この式で表現できる」ということです。体重70kgの学生の身長は,式に当てはめることによって169.5cm程度だと予想することができる,ことになります。

つまり,回帰式を書く(回帰分析をする)ことによって,大学4年生の体重から,身長を予想することができるようになるのです。

実際には,この後にF検定をして,この式の妥当性(あてはまりの程度)を調べなければなりません。その際に,R二乗値・等分散性・残差分析などについての知識が無ければ歯が立たないでしょう。

その辺りまで勉強し始めると,卒論には全然間に合わないですから,とりあえずは,回帰分析のやり方だけ覚えて,その辺りは目をつぶったらどうでしょう? 卒論ならそれでも通ると思いますよ。
    • good
    • 1
この回答へのお礼

親身なアドバイス、痛み入ります。

>その辺りまで勉強し始めると,卒論には全然間に合わないですから,とりあえずは,回帰分析のやり方だけ覚えて,その辺りは目をつぶったらどうでしょう? 卒論ならそれでも通ると思いますよ。

もう時間がないのでそうしたいと思います。
ありがとうございました。

お礼日時:2009/01/24 17:47

No.5つづきです。



回帰分析の「やり方」については、他の方が説明されているので、
回帰分析の「意味」というか、「何に使うか」をちょっと説明しておきますね。

先に高校のクラスの「身長と体重」の例を出しましたが、普通、両者には正比例のような関係があることがわかりますよね。
もう少し正確に言うと「相関関係」というんですが、この相関関係を探るための手法が回帰分析とお考えください。

もっとも、「関係を調べたら右上がりになった」というだけじゃ不十分です。
とうのは、「分布がどの程度右上がりか」という要素の他に、「分布がどの程度密集しているか」と言う要素もあるからです。
つまり、一つ一つの点が密集していれば「相関が強い」ことになるし、けっこうバラバラで、
身長が低いのに体重がある人が多かったり、高いのに軽い人が多かったりすれば「相関が弱い」ことになります。

まあ、身長と体重は相関関係が強いほうなんでしょうが、
たとえば、「学生の偏差値」と「その親の高校時代の偏差値」はどうなんでしょうね。
多少はあるんでしょうが、強い相関なのかどうか・・・。
また、「親の所得」と「子どもの偏差値」なんていうとどうなんでしょうね?あるとも言われてますが、実際調べたらどの程度の相関の強さなのか。
関係がかなり強ければ、所得の低い親を持った子は絶望的な気持ちになるでしょうし、
関係が弱ければ、いちおう右上がりの関係があっても、「例外も多いからねえ」ということで救われますね。

まあ、そういったいろいろな数字の関係を調べるのに使うのが回帰分析だと考えておけばさしあたりは大丈夫だと思います。
    • good
    • 0

>回帰分析とはいったいどのようなものなのか分かりやすく教えて頂けないでしょうか?


 何度か同じような質問に回答しています。計算はエクセルで簡単。

卒論なら、指導教授に訊く
だめなら、その理由を書き、3日待つ
旅先から帰って、理由をかいてあれば、教える。
    • good
    • 1

No.2の回答者です。



3点補足しておきますね。

1.
「回帰」のことを「最小二乗法」とも言います。
(最小自乗法ともいう)
調べ物をするときのキーワードとして覚えておくとよいですよ。
(厳密に言えば違うのですが、世の中で行われている回帰は、ほぼ100%最小二乗法です。)


2.
エクセルにおいてグラフを作るとき、
グラフの種類は、折れ線グラフや棒グラフではなく「散布図」を洗濯します。
これを知らないがために最初戸惑う人が多いので、覚えておくとよいでしょう。


3.
実際の手順やグラフの例が書かれたサイトを見つけましたので、参考にしてください。

エクセルを利用した例 その1
http://szksrv.isc.chubu.ac.jp/lms/lms2.html
エクセルを利用した例 その2
http://homepage1.nifty.com/gfk/sohkan-keisuu.htm

右上に四次関数のグラフに回帰した例があります。
http://ja.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F% …


以上、ご参考になれば幸いです。
    • good
    • 0
この回答へのお礼

エクセルを利用した例のリンクを貼り付けて頂きありがとうございます!

実際に自分でやるときに大いに参考にさせて頂きます。

お礼日時:2009/01/23 22:18

高校のクラスに男女合わせて30人の生徒がいる。


30人の平均体重を出したら55kgだった。
その場合、身長が180m、体重が65kgの生徒をつかまえて、
「あなた平均を10kgも超えてるから太りすぎ」と言うのは無意味ですね。
身長に応じた平均体重といったものを出す必要がありますから。

で、グラフ用紙に、ヨコ軸に身長、タテ軸に体重をとって、
一人ひとりの値をプロットしていくと、普通は右上がりの分布になりますね。
その分布の真ん中に右上がりの線が引けるような式を見つけるわけです。

大雑把に言えば、それが回帰分析です。

http://gucchi24.hp.infoseek.co.jp/MRA1.htm
このサイトがわかりやすいかも。
    • good
    • 0
この回答へのお礼

わかりやすい例題ありがとうございます!
少しだけ理解できた気がします。

お礼日時:2009/01/23 22:17

分析自体はエクセルで簡単にできます。

数値を選択して,ビスタならタブのデーターの中のデーター分析を選択し,回帰分析を選択します。もしかしたら回帰分析が入っていない事があるので,その時はアドインで追加すれば大丈夫です。

経済学部であれば,高校の数学Cの教科書,新世社の統計学入門が参考書になります。エクセルで出した結果を,参考書と参照しながら学習されれば良いと思います。
    • good
    • 0
この回答へのお礼

詳しい解説をありがとうございます。全部が全部自分でやらなくてもいいのですね!少し救われた気持ちになりました!

お礼日時:2009/01/23 14:25

#1ですが、補足として変数が2つ(つまりXとYしかない)の場合、一番手っ取り早いのは、Excelで横軸にX、縦軸にYの散布図を描いて近似曲線を引く方法です。

(正直これだけやっておけばOKだと思います)
    • good
    • 0
この回答へのお礼

回答ありがとうございます。これから勉強してみます。

お礼日時:2009/01/23 14:23

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Qカイ2乗検定って何??;;

タイトルのとおりですが…大学で統計の基礎な授業を一般教養で受けています。だけど知らない&説明のない言葉がいっぱぃで、全くついていけません(>_<))
「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、有意水準1%としてカイ2乗検定をして判断する、という問題があるのですが、カイ2乗検定自体、授業でちらっと言葉は使ったものの、計算の仕方、使い方の説明等はなく、まったく手がつかずにいます;;ネットでも調べてみましたが、どう使っていいのかまでは分かりませんでした。
知識の無い私でもわかるようなものがあれば教えて下さいっっ!お願いします。

Aベストアンサー

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布とは,二乗値に関する確率分布と考えることができるのですが,この辺もさらりと流して下さい.

例を使って説明します.今,道行く人にA,B,C,Dの四枚のカードの中から好きなもの一枚を選んでもらうとしましょう(ただし,選んでもらうだけで,あげるわけではありません.単にどのカードを選択仕方の情報を得るだけです).一人一枚だけの条件で,160人にカードを選んでもらいました.
さて,ここで考えてみて下さい.4枚のカードには大きな違いはなく,どれを選んでもかまわない.でたらめに選ぶとなれば,どのカードも1/4で,同じ確率で,選ばれるはずですよね? ならば,160人データならば,Aは何枚ほど選ばれる「はず」でしょうか? 同様に,B,C,Dは何枚選ばれる「はず」でしょうか?
……当然,A=B=C=D=40枚の「はず」ですよね? この40枚という数値はでたらめに(無作為に)選ばれたとしたらどんな数値になるかの【理論値】を意味します.

さて,上記はあくまでも理論値であり,実際のデータは異なる可能性があります.というよりはむしろ違っているのがふつうでしょう.そのような実際に観測された数値を【観測値】と呼びます.
仮に理論値と観測値が以下のようになったとします.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40

当然のように観測値と理論値にズレが生じています.しかし現実と理論が異なるのはある意味当然なのですからぴったり一致することなどありえません.そこで,「ある程度一致しているか(ズレは許容範囲か)」を問題にすることになります.しかし,「ある程度」といわれても一体どのぐらいであれば「ある程度」と言えるのでしょうか? なかなか判断が難しいではないですか?
確かに判断が難しいです.そこで,この判断のために統計学の力を借りて判断するわけで,更に言えばこのような目的(理論値と観測値のズレが許容範囲かどうか)を検討するときに使われるデータ解析法がχ2検定なのです.

        A    B    C    D
(1)観測値   72   23   16   49
(2)理論値   40   40   40   40
(3)ズレ    +32   -17   -14   + 9
(4)ズレ二乗 1024   289   196   81
(5)(4)÷(2) 25.6  7.225  4.9  2.025

 χ2=25.6+7.225+4.9+2.025=49.25

計算過程をさらりと書いていますが,早い話が観測値と理論値のズレの大きさはいくらになるのか,を求めることになります.最終的には「49.25」というズレ値が算出されました.

さて,この「49.25」というズレ値が許容範囲かどうかの判定をするのですが,ここで,χ2分布という確率分布を使うことになります.詳細は統計学教科書を参考してもらうとして,χ2分布を使うと,○○というズレ値が(ある条件では)どのぐらい珍しいことなのか,という「珍しさの確率」を教えてくれます.
かりに「有意水準1%=1%よりも小さい確率で発生することはすごく珍しいと考える(許容範囲と考えられない)」とすれば,「珍しさ確率」が1%以内であれば「許容範囲ではない」と判断します.

以上,長々と書きました.今までの説明を読めばわかるように,χ2検定とはある理論値を想定した時,実際の観測値がその理論値とほぼ一致しているかどうかを調べるための統計解析法のことです.

χ2検定では,理論値をどのように設定するかは分析者の自由です.その設定の仕方で,χ2検定は「適合度の検定」や「独立性の検定」など異なる名称が付与されますが,本質は同じなのです.

質問者さんの場合は

> 「人が一番選ばなさそうな数字」を何度か投票した結果があって、その数字は無作為に選ばれてるかどうか、

これを理論値としてうまく設定することが鍵となるでしょう.

こんにちは.χ2(カイ二乗)検定を厳密に理解するには,数学的素養を持っている状態できっちりと統計学を学習する必要があるのですが,統計データを解析するための手段として統計学を「使う」のであれば,多少の原理を知っておけばよいでしょう.
以下初学者向けにかなり乱暴な説明をしています.正確な理解をしたければ,後で統計学の教科書などで独学して下さい.

χ2検定とは,χ2分布という確率分布を使ったデータ解析法と考えてもらう……のが一番なのですが,多分χ2分布って何? と思われるでしょう.χ2分布...続きを読む

Q加重平均と平均の違い

加重平均と平均の違いってなんですか?
値が同じになることが多いような気がするんですけど・・・
わかりやす~い例で教えてください。

Aベストアンサー

例えば,テストをやって,A組の平均点80点,B組70点,C組60点だったとします.
全体の平均は70点!・・・これが単純な平均ですね.
クラスごとの人数が全く同じなら問題ないし,
わずかに違う程度なら誤差も少ないです.

ところが,A組100人,B組50人,C組10人だったら?
これで「平均70点」と言われたら,A組の生徒は文句を言いますよね.
そこで,クラスごとに重みをつけ,
(80×100+70×50+60×10)÷(100+50+10)=75.6
とやって求めるのが「加重平均」です.

Q相関分析の相関係数と重回帰分析の偏回帰係数の違いの説明

実は会社での説明に苦慮しています。
例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。
どなたかお知恵をいただきたく、よろしくお願いします。

Aベストアンサー

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チームの防御率をX1、チームの打率をx2、すなわち、説明変数を複数(2つ以上)採り、順位yの推定を行うのが、重回帰分析です。
 このように、単回帰分析よりも、重回帰分析の方が、必ず相関係数が高くなります。すなわち、結果の推定の確実性が増すわけです。相関係数が、1.0になれば、説明変数の事柄だけで、従属変数の事柄が決定できます。すなわち、100%的中します。

 単回帰では、防御率、打率とも、相互の影響は考慮されていません。従って、防御率と打率のどちらが影響力が強いのかは、相関係数から予測はできるものの、決定できません。選手をとる場合、同じ年俸を払うのに、ピッチャーとバッターのどちらを補強したら効果的かは、判断が困難です。
 このとき、どちらの影響が強いかを推定できるのが、重回帰分析です。そのために利用するのが、偏回帰係数ですが、変数の単位に左右されるので、注意を要するところです。

 「単回帰では、(1)(2)(3)のどれが最も効果的かは、判断できません」が答えでしょうか。
 釈迦に説法の点は、ご容赦を。
  

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チー...続きを読む

Q回帰式と近似式について

回帰式と近似式の違いについてどなたか教えてください。
回帰式とは最小二乗法で求めた式(1次式に回帰して?)、近似式とは実測値に基づいてなんらかの方法で算出した式の事でしょうか?数学の知識に乏しいのでよくわかりません。宜しくお願い致します。

Aベストアンサー

No.2です。補足質問にお答えします。

> 予測値と実測値の差は 回帰式<近似式 なのでしょうか?

ちょっと意味不明です。

もう一度整理してみます。
まず回帰式と近似式は別物と考えた方がいいです。
y=f(x)という関数(理論式又は経験式)が有るとします。

関数そのものは判っているが、複雑で取り扱いが面倒なので
実用的に差支えが無い程度に簡略化して使うというのが近似式です。
No.2であげた例がそれにあたります。

次に関数の次数はわかっているが係数が判らない時又は全く何もわからない場合に
実測値又は実験値から元の関数を推定するのが回帰式です。
これは統計的処理というか数学的(算数的)処理で行います。

さらに
理論値・・理論式がわかっている場合
予測値・・普通は経験式がわかっている場合
実測値・・説明の必要は無いでしょう
近似値・・近似式で値を求めた場合、
  又はまるめを行った場合:例えば円周率πを3.14で近似

最後に、無理やり解釈すれば回帰式は理論式又は経験式の代用品という意味では
近似式の仲間に入ると言えなくも無いでしょう。
真ならずとも遠からず・・ですね。

No.2です。補足質問にお答えします。

> 予測値と実測値の差は 回帰式<近似式 なのでしょうか?

ちょっと意味不明です。

もう一度整理してみます。
まず回帰式と近似式は別物と考えた方がいいです。
y=f(x)という関数(理論式又は経験式)が有るとします。

関数そのものは判っているが、複雑で取り扱いが面倒なので
実用的に差支えが無い程度に簡略化して使うというのが近似式です。
No.2であげた例がそれにあたります。

次に関数の次数はわかっているが係数が判らない時又は全く何もわから...続きを読む

Q前年比の%の計算式を教えてください

例えば前年比115%とかよくいいますよね?

その計算の仕方が分かりません・・・
例えば 前年度の売り上げ2.301.452円
    今年度の売り上げ2.756.553円
の場合前年比何%アップになるのでしょうか?計算式とその答えを
解りやすく教えて下さい・・・
バカな質問でゴメンなさい(><)

よろしくお願いします。

Aベストアンサー

 
(今年の売上÷前年の売上×100)-100=19.8%の売上増加

 

Qエクセルの指数近似曲線の式から値を計算する

有るデータを元に指数近似曲線を描かせると「y = 2E+08e-0.098x R² = 0.9847」と出ました。
インターネット等を参考にしてエクセルで値を計算させようとして以下の式を作りましたが計算結果が全く元データと合いません、何が間違っているのでしょうか?教えて下さい。
y = 2E+08e-0.098x⇒y=2*POWER(10,8)*EXP((-0.098*x))

Aベストアンサー

質問者様はグラフに表示された数式と同じワークシートの数式を正しく作成されています。
(実際の数式ではyはなくxのところにセル参照が入っているのですよね)
元データと合わない原因ですが、グラフに表示された数式の係数の精度不足ではないでしょうか。
それが原因であれば、グラフに表示された数式の表示形式を変更して係数の精度を上げ、その数値でワークシートの数式を作り直せば多くの場合解決します。
どのような数値でも精度良く表示するためには、表示形式を指数にして小数点以下14桁にするとよいと思います。

ご存知かもしれませんが、以下念のためグラフに表示された数式の表示の変更方法を説明します。
Excel2003とExcel2007についての解説となりますが他のバージョンも大きくは違わないと思いますのでそこのところの対応はよろしくお願いいたします。
1.グラフに表示された数式を右クリック
2.2003なら「データラベルの書式設定」をクリック、2007なら「近似曲線ラベルの書式設定」を左クリックする。
3.書式設定のダイアログが出るので、「表示形式」を左クリック(2003は上、2007は左上。最初からクリックされた状態になっている可能性あり。)
4.「分類」(表示形式)の「指数」を左クリック。(「数値」はNG)
5.「小数点以下の桁数」を14にする。(最大30だが「分類」(表示形式)が「指数」ならば15以上は無意味。Excelの精度が15桁であるため。)
6.「OK」を左クリック

なお、質問者様の作成された式の「2*POWER(10,8)」の部分ですが、「2*10^8」「2E+08」「2e8」などとしても数式の値としては同じになります。

質問者様はグラフに表示された数式と同じワークシートの数式を正しく作成されています。
(実際の数式ではyはなくxのところにセル参照が入っているのですよね)
元データと合わない原因ですが、グラフに表示された数式の係数の精度不足ではないでしょうか。
それが原因であれば、グラフに表示された数式の表示形式を変更して係数の精度を上げ、その数値でワークシートの数式を作り直せば多くの場合解決します。
どのような数値でも精度良く表示するためには、表示形式を指数にして小数点以下14桁にするとよいと思...続きを読む

QEXCELで縦の行全てに一括して文字を追加。

EXCELにて、縦の行全てに一括して文字を追加する方法はありますでしょうか?
同じ文字を入力するのはやや面倒なので。。
ご教授お願い致します。

Aベストアンサー

その列に既に入力されている文字が全て同じなら、追加は簡単です。

例として、A列の全てのセルに"goo"を追加入力する場合を書きます。

(1)まず、A列(縦の行って列の事ですよね?)を選択。
(2)そのままの状態で数式バーの最後尾に"goo"と入力し、確定。
(3)次にctrlを押しながらenterを押す。

これでA列全てのセルの文字列に"goo"が追加されます。

ご質問の意図と違っていましたらごめんなさい。

Q統計学 t値の表を見るときの自由度

自由度Φ は (データ数-1) か、(データ数-2)のどちらを選ぶべきか、基準を教えて下さい。
t値の表を見るとき、迷っています。
データ数によってなのか、母平均に対応のあるないと関係があるのか・・・

Aベストアンサー

こんにちは.
t検定はその使用目的から三つの場合で自由度を見分ける必要があります.

1)ある条件の平均値と定数との差の検定の場合
 例えば,ある学級集団のIQが102であり,全国平均のIQ100よりも有意に高いといえるかどうか.このような場合にt検定を使う場合は次の計算で自由度を求めます.

 自由度=データ数-1

2)対応がない二つの条件の平均値の差の検定
 質問者さんは対応なし/ありの区別がついているようなので,以下簡単に説明をします.
 A条件で10人,B条件で8人のデータにおいてAとBの二つの平均値の差を調べる場合では次のようになります.

 自由度=Aデータ数+Bデータ数-2
 例) 16

3)対応がある二つの条件の平均値の差の検定
 この場合では,AB条件ともに同数データとなります.いまA条件データ数(=B条件データ数)が9とします.

 自由度=一方の条件データ数-1
 例) 8


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング