統計学 相関係数の算出に関する質問

統計学の勉強中ですが、以下の問題で悩んでます。

「10個のデータの組(Xi,Yi)があり、Xの総和が20、Yの総和が20、X^2の総和が50、Y^2の総和が50、XYの総和が30である。
最小二乗法で回帰直線を求め、その上で相関係数を求めよ。」

最小二乗法で回帰直線の方程式が Y=-X+4 であることは求められましたが、
その次の相関係数の算出でつまづいてます。

どなたか、解法を教えてください。

補足ちなみに、Excelではなく手計算での算出です。
同様の問題を自力で解答できるように、
途中式等の解法の説明も、よろしくお願いします。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

添付図をご覧ください。



偏差の和をSで表しました。

回帰係数(傾き)を求めた計算同様に,
Syyを求めて計算すればよいのです。
「統計学 相関係数の算出に関する質問」の回答画像1
    • good
    • 0
この回答へのお礼

解答、ありがとうございます。

やっぱり-1なんですね。何回計算しても、この値にしかならず、
これでは完全なる相関関係になるので違うんじゃないかと思ってました。
同様の問題も、同じ様にチャレンジします。

お礼日時:2011/04/27 08:09

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qエクセル プルダウンの作り方

お世話になります。
エクセルでプルダウンの作り方を教えていただけませんでしょうか?
住所を▼のボタンでクリックしたら【北海道,青森,秋田,岩手・・・】などの選択ができるようにしたいのです。
宜しくお願いします。

Aベストアンサー

メニューから「データ」、「入力規則」、「設定」で「入力値の種類」を「リスト」を選択します。
そうすると「元の値」という表示がでますので、そこで前もって作っておいたリストの範囲を指定します。
多くないのでしたら、そのままそこにカンマで区切って入力しても出来ます。

Q統計学の相関係数について

直線のときに相関係数が最大・最小をとるとありますが何故直線のときなのでしょうか?

自分なりの考えでは、第1~4象限すべてに散布していると相殺して0になるように、たとえ第1・3象限に留まっていようとその中でプチ相殺してしまうから、そうならない究極の形が直線であったのでないか説を立てましたが実際どうなのか疑問です

Aベストアンサー

相関係数をr, Xi の平均値を x , Yi の平均値を y とする。

r=Σi{(Xi -x)×(Yi -y)}/{rootΣi(Xi -x)^2 ×rootΣj(Yj -y)^2}

y=ax+b のとき、

r=Σi{(Xi -x)×a(Xi -x)}/{rootΣi(Xi -x)^2 ×rootΣja^2(Xj -x)^2}

= a / lal

=±1

こんな感じでどうでしょうか?

Qエクセルでプルダウンメニューの作り方

  エクセルの画面で、よく三角形を逆さまにした形をクリックするといくつかメニューが出てき、どれかを選べるようになっていますが、その作り方を教えてください。
 会社で人事を担当していますが、三角形(プルダウンボタン)をクリックすると社員氏名一覧が表示され、そこから選択できるようにしたいのです。
 しばらく自力でいろいろやってみましたが、さっぱり見当がつかず、どうやればいいのか分かりませんでした。よろしくお願いします。

Aベストアンサー

こんばんは!
当方使用のExcel2003での一例です!

↓の画像のようにSheet2に名簿表を作成しておきます。
画像ではSheet2のA2セル以降を範囲指定 → 名前ボックスに仮に「名簿」と入力しOK
これで範囲指定したセルが「名簿」と名前定義されましたので、

Sheet1のリスト表示させたいセルを範囲指定 → メニュー → データ → 入力規則
→ リスト → 「元の値」の欄に
=名簿
としてOK

これでSheet1のセルをアクティブにすると右側に下向き▼が表示されますので、そこをクリック!
これで希望に近い形にならないでしょうか?
Excel2007の場合は↓のURLが参考になるかもしれません。

http://www.eurus.dti.ne.jp/~yoneyama/Excel2007/excel2007-ny_kis2.html

尚、同一Sheetに「名簿表」を作成する場合は名前定義する必要はなくて
「元の値」の右側の四角をクリックし、リスト表示したいセルをそのまま範囲指定すればOKです。

以上、お役に立てば良いのですが・・・m(_ _)m

こんばんは!
当方使用のExcel2003での一例です!

↓の画像のようにSheet2に名簿表を作成しておきます。
画像ではSheet2のA2セル以降を範囲指定 → 名前ボックスに仮に「名簿」と入力しOK
これで範囲指定したセルが「名簿」と名前定義されましたので、

Sheet1のリスト表示させたいセルを範囲指定 → メニュー → データ → 入力規則
→ リスト → 「元の値」の欄に
=名簿
としてOK

これでSheet1のセルをアクティブにすると右側に下向き▼が表示されますので、そこをクリック!
これで希望に近い形にならない...続きを読む

Q統計学、共分散・相関係数です

    Y=1 Y=3
X=2 2/8 1/8
X=4 3/8 2/8

 という同時確率分布における共分散と相関係数なのですが…XとYの共分散は1/16、相関係数は400/289と出たのですが…合ってあるでしょうか?すごく間違ってる気がするのですが(>_<)。

 間違えていましたら、正しい答えを教えて頂けたら非常に助かります;。ヒントでも結構です。お願いします!

Aベストアンサー

全部答えるとルール違反なので概略だけです。

共分散はあってます。

相関係数は必ず-1と1の間にあるので間違いです。相関係数は
ρ = Cov(X,Y) / √{Var(X)*Var(Y)}
なので、X と Y の分散(大体1くらいになります)を求めれば計算できます。

Qエクセル(Excel) 納品書の作り方【画像修正版

昨日http://oshiete.goo.ne.jp/qa/7348426.htmlで質問させていただき、詳しくご回答いただき少し進んだのですが、状況が変わったので改めて質問させていただきます。

■エクセル(Excel)で納品書の作成をしています。
シート1に納品書、シート2に商品マスタ(一覧)を作っていて、シート2の一覧を反映させて
納品書に番号を打ち込むだけで、商品名・単価までが出るシステムを作りたいのですが、
昨日のご回答の中の「VLOOKUP」?を入れて、自分なりにマス目の数字を変えてやってみたのですが
反映されずN/?のようなエラーになってしまいます。

※画像が見にくかったのでシート<CENTER></CENTER>だけにしました。

1、上記のように、シート2との関連付けの係数を、写真の場合の数字で教えてください。

2、合計と、合計から20%を引いた数値を割り出す関数も、写真の数字で御願いします。

宜しくご教授お願い致します。

Aベストアンサー

こんばんは!
前回投稿した者です。

当方もかなり古い(人間も古い!なぁ~んちゃって!)Excel2003を使用しています。
↓の画像のようにSheet2にデータを作成しておきます。

#N/A というエラーは、「検索値」がない!ということですので
お示しの画像のB列にSheet2のA列にないデータを入力するとそういったエラーが表示されます。

画像のセル配置ですと
C4セルに
=IF($B4="","",VLOOKUP($B4,Sheet2!$A:$C,COLUMN(B1),0))
(「$」マークの位置に気を付けてください)
という数式を入れD4セルまでオートフィルでコピー!
そのまま最後の24行目までコピーしておきます。

F4セルには
=IF(COUNTBLANK(B4:E4),"",D4*E4)
という数式を入れ、F24までオートフィルでコピー!

これでB列に商品番号を入力すればSheet2のデータが反映され、
E列に数量を入力でF列に金額が表示されると思います。

最後に合計金額のF26セルは
=IF(COUNT(F4:F24),SUM(F4:F24),"")
手数料のF27セルは
=IF(F26="","",F26*0.2)

これで何とか形にならないでしょうか?

※ 振込金額の欄は不明ですので手を付けていません。

参考になりますかね?m(_ _)m

こんばんは!
前回投稿した者です。

当方もかなり古い(人間も古い!なぁ~んちゃって!)Excel2003を使用しています。
↓の画像のようにSheet2にデータを作成しておきます。

#N/A というエラーは、「検索値」がない!ということですので
お示しの画像のB列にSheet2のA列にないデータを入力するとそういったエラーが表示されます。

画像のセル配置ですと
C4セルに
=IF($B4="","",VLOOKUP($B4,Sheet2!$A:$C,COLUMN(B1),0))
(「$」マークの位置に気を付けてください)
という数式を入れD4セルまでオートフィルで...続きを読む

Q相関分析の相関係数と重回帰分析の偏回帰係数の違いの説明

実は会社での説明に苦慮しています。
例えば、携帯電話の(1)メーカー/(2)デザイン/(3)機能の(4)購入意向、に対する影響度を見たい、という時に、重回帰分析における偏回帰係数で(1)(2)(3)の(4)に対する影響度を測ろうとしているのですが、「(4)と(1)(2)(3)それぞれの相関の高さで見るのと何が違うのか?」と聞かれてしまい、回答に窮しています。あまり統計に詳しくない人(私もそうですが)に対し、うまく説明する方法はないでしょうか。
どなたかお知恵をいただきたく、よろしくお願いします。

Aベストアンサー

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チームの防御率をX1、チームの打率をx2、すなわち、説明変数を複数(2つ以上)採り、順位yの推定を行うのが、重回帰分析です。
 このように、単回帰分析よりも、重回帰分析の方が、必ず相関係数が高くなります。すなわち、結果の推定の確実性が増すわけです。相関係数が、1.0になれば、説明変数の事柄だけで、従属変数の事柄が決定できます。すなわち、100%的中します。

 単回帰では、防御率、打率とも、相互の影響は考慮されていません。従って、防御率と打率のどちらが影響力が強いのかは、相関係数から予測はできるものの、決定できません。選手をとる場合、同じ年俸を払うのに、ピッチャーとバッターのどちらを補強したら効果的かは、判断が困難です。
 このとき、どちらの影響が強いかを推定できるのが、重回帰分析です。そのために利用するのが、偏回帰係数ですが、変数の単位に左右されるので、注意を要するところです。

 「単回帰では、(1)(2)(3)のどれが最も効果的かは、判断できません」が答えでしょうか。
 釈迦に説法の点は、ご容赦を。
  

相関分析と重回帰分析の違いは、説明変数を一つとするか複数にするかの違いです。
 目的とするもの(従属変数、数式ではy)に影響するものが、説明変数(数式ではx)です。

 プロ野球を例に取ると、野球はピッチャーだ、といわれます。そこで、過去数年間について、ピッチャーのチーム防御率だけをXとし(説明変数が単数)、その年の順位をyとして、分析するのが単回帰分析です。
 しかし、いくらピッチャーが良くても、打てなければ勝てません。そこで、バッターの打率も考える必要があります。すなわち、チー...続きを読む

Qエクセル(Excel) 納品書の作り方【改めて】

昨日http://oshiete.goo.ne.jp/qa/7348426.htmlで質問させていただき、詳しくご回答いただき少し進んだのですが、状況が変わったので改めて質問させていただきます。

■エクセル(Excel)で納品書の作成をしています。
シート1に納品書、シート2に商品マスタ(一覧)を作っていて、シート2の一覧を反映させて
納品書に番号を打ち込むだけで、商品名・単価までが出るシステムを作りたいのですが、
昨日のご回答の中の「VLOOKUP」?を入れて、自分なりにマス目の数字を変えてやってみたのですが
反映されずN/?のようなエラーになってしまいます。

※画像が貼り付けてあります。商品名は1番以外伏せさせていただいています。
くっつけてありますが、左側がシート1・右側がシート2です。

1、上記のように、シート2との関連付けの係数を、写真の場合の数字で教えてください。

2、合計と、合計から20%を引いた数値を割り出す関数も、写真の数字で御願いします。

宜しくご教授お願い致します。

Aベストアンサー

画像がいまいちよく見えないのですが、納品書の項目は左から、No、商品番号、商品名、単価、数量、金額でいいのでしょうか(名前は多少違っていても意味があっていればもんだいないです)

でしたら、
C1セルに=IF(ISBLANK(B2),"",VLOOKUP(B2,Sheet2!$A$2:$C$200,2,FALSE))
D1セルに=IF(ISBLANK(B2),"",VLOOKUP(B2,Sheet2!$A$2:$C$200,3,FALSE))
E1セルは空白で
F1セルに=IF(D2="","",D2*E2)
といれて、C1からF1までをコピーしてその下の行にタテに貼り付ければ出来ますよ。
おそらくエラーが出たのは、コピーしたときにVLOOKUP関数の最初のセルの指定がずれてしまっているのでは無いかと思いますよ。     

Q相関係数と決定係数

素人質問で恐縮ですが相関係数と決定係数の違いを教えてください。
相関係数を2乗すると決定係数になるというのは分かるのですが、それぞれの指標をどのように見ればいいのかわかりません。大変恐縮ですがよろしくお願いいたします。

Aベストアンサー

以下のURLは参考になるかと思います。

http://www.geisya.or.jp/~mwm48961/statistics/coef_det1.htm

疑問点が解決すればいいのですが。

Qエクセル2007でプルダウンで選んだものに反応

Excel2007でプルダウンで選んだものに反応して隣のセルが自動入力される方法(エクセル2007)
A1をプルダウンで「猫」「犬」から選べるようにし、「猫」を選んだ場合B1に自動に「111」が、「犬」を選んだ場合B1に自動に「222」と入力されるようにしたいです。
ご教授の程、宜しくお願いします。

Aベストアンサー

VLOOKUP関数での方法です。
(1)別シートに入力文字列と対応コード表を作成。(仮にSheet2のA:B列範囲で順不同)
(2)B1に=IF(COUNTIF(Sheet2!A:A,A1),VLOOKUP(A1,Sheet2!A:B,2FALSE),"")を設定
   入力文字列が存在しない場合は空白としています。

Q共分散、相関係数と相関性について

ファイナンス(証券投資のポートフォリオ)の学習をしているのですが、共分散と相関係数が良く理解できなかったので、こちらのカテゴリにて質問させて頂きます。


共分散は、その絶対値が高い程、相関係数は、その絶対値が1に近い程、両者の相関性が高いとされているようですが、この理屈についてご教示頂けないでしょうか?

当方、数学に弱く、四苦八苦しております。

どうぞよろしくお願い致します。

Aベストアンサー

式なしで簡単な考え方だけ説明しますと、

Aが高いほどBが高い、という対応関係が、全データ(A,Bの組)でAの増え方とBの増え方が完璧に対応しているときに、相関係数が+1、となるような定義をしてあります。

Aが高いほどBが低い、という逆方向だけど、Aの増え方とBの減り方が完璧に対応しているときに、相関係数が-1となるように定義されています。

そのため、相関係数は、最低でも負の相関(-1)、最高でも正の相関(+1)の間にしかなりません。少しずつ完璧な対応からずれているものがあると、対応が一直線にならずに、そのラインからばらけてきます。

相関係数 - Wikipedia
http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0

共分散は、この相関係数を求めるときに使うもので、共分散をAの標準偏差とBの標準偏差で割ると、相関係数が求まります。これによって、相関係数が-1から+1の範囲に収める役目もさせているのですね。

なお、経済の分野で特に注意すべきなのは、上のサイトにも言及がある「擬似相関」というものです。

『 3.第3の変数C が A と B を発生させる (この場合、AとBの間に因果関係はなく擬似相関と呼ばれる)』

A と B が直接に原因→結果となって対応しているのではなくて、全く別のC が共通の原因で Aになる理由とBになる理由は全く別物、ということがありえるので、相関係数だけから判断すると危険、というものです。

式なしで簡単な考え方だけ説明しますと、

Aが高いほどBが高い、という対応関係が、全データ(A,Bの組)でAの増え方とBの増え方が完璧に対応しているときに、相関係数が+1、となるような定義をしてあります。

Aが高いほどBが低い、という逆方向だけど、Aの増え方とBの減り方が完璧に対応しているときに、相関係数が-1となるように定義されています。

そのため、相関係数は、最低でも負の相関(-1)、最高でも正の相関(+1)の間にしかなりません。少しずつ完璧な対応からずれているものがあ...続きを読む


人気Q&Aランキング

おすすめ情報