プロが教える店舗&オフィスのセキュリティ対策術

統計に関する質問です。
私は勤務先(金融)で特定の業種の財務分析をしているのですが、データの分析方法(回帰分析)で分からない点があります。

具体的には下記の通りです。

【状況】
ある業種業界について、2つのデータ(例えば、総資産と売上高)を収集しました。
データは5年間分をパネルとして扱っており、総数は400くらいです。
2つのデータ間に何らかの関係をあると考え、総資産を横軸、売上高を縦軸、としてエクセルで散布図を作成したところ、右上がりの関係があるように感じました。

エクセルの機能で近似値線(直線)を引いて、算式とR2を表示したところ、算式の傾きはプラスで、R2は0.2程度でした。
その後、回帰分析を行い、分散分析表を作成しました。
相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。
回帰係数も検定したところ、1%水準で有意な関係、との結果でした。

【私の主張】
私は「統計学的に考えて、総資産の増加に伴い売上高が増加する傾向がある」と述べたいのですが、
(なお、背景にある理論は別途構築しており、業界内でも理解が得られると思われます。)

【ご質問】
1. 回帰分析の結果から、回帰直線の傾きがプラスで、相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しいと言えるのでしょうか?評価は個人ですべきものだとは存じますが、考え方・説明方法に無理があればご教示をお願い申し上げます。

2. もし、上記1の質問が的外れであれば、どのような点がおかしいのでしょうか。ご教示いただきますようお願い申し上げます。

抽象的な部分もございますが、何卒ご教示のほど、お願い申し上げます。

【前提】
上記は私の職務柄、個人で利用する目的で作業を行っています。
論文その他レポートの作成を目的としておりません。

A 回答 (3件)

No2です。


>相関分析と回帰分析
私は分けた方が考えやすいので区別していますが、教科書的ではありません。

>私の考え方は有意性の検定に固執していた感があります。
推測統計学(推計学)では、有意差が無いと、何も言えません。ですから、固執するべきです。

>横軸x(例えば総資産)の増加に伴い、縦軸y(例えば売上高)も増加する傾向にある、という内容です。
これだと、相関係数に有意差があり、回帰式の回帰係数が正であれば十分です。誰も異論は唱えられません。ですから、No2で、「統計学的な方法自体は、正しいと考えます。」と回答しました。

>「xの増加に伴ってyが増加する関係を正の相関という」との内容でしたので、正の相関関係が示されれば良いのかな、と考えています。
統計学の教科書は、それで十分です。しかし、実際に(=社会的に)応用するには、因果関係の検証が必要で、それに関する記述は、統計学の教科書にはありません。
 すなわち、相関の場合、因果関係が無いと、見かけ上の関係、すなわち擬相関の問題が生じます。私の研究課題である平均寿命で例にとります。
 世界各国の新聞の発行部数と平均寿命には、決定係数が0.6はあります。すなわち、強い正の相関があるので、統計学的には「新聞を読めば、健康に関する知識が増えるので、平均寿命が伸びる」を主張できます。しかし、新聞を読んだくらいで寿命が伸びるとは考えられません。それなら、病院を潰して、その費用を新聞に回せば良いのです。因果関係がないと、実社会では誤った結論に陥りかねない、ということです。これを見かけだけの相関、擬相関といいます。

 株の話は、どうでしょう。株価の変動で、直線的に右上がりのグラフを良く見ます。すなわち、回帰式は、右上がりです。相関も強い正でしょう。
 しかし、横軸は年月です。年月と株価に因果関係があるのなら、この回帰式は、常に成立します。しかし、現実は暴落。これは因果関係がないからです。

>「データ間の因果関係を検証した後(内容に矛盾がないことが前提ですが)、相関分析を行い、有意な正の相関関係が示されれば、私の主張は統計学的に間違っていない」と考えて宜しいのでしょうか。
  私の順序は、
1) 相関係数を算出する
2) 相関係数とデータ数から、有意差を見出す。
3) 因果関係の5要件について、その全てを満たしていることを示す。
 5要件の一つの判定に、私は相関係数を使うので、2)は3)より先にします。

 この5要件の判定が、実は厄介です。その最大の理由は、教科書に分ったように書いてあるが(政治家に似て、表現は美しいが)、実は何にも分らない(具体的な判定法を書いていない)。例えば、密接性だと、「強固な関連があること」と書いてあったりします。強固か否かの判定法は、書いてありません。密接性の判定には、相関係数を利用しています。悪戦苦闘した所以です。
 因果関係の判定は、ご自身で経験を積んで下さい。
    • good
    • 0
この回答へのお礼

ご回答を戴きまして誠にありがとうございました。
お礼が遅くなりまして申し訳ございません。

ご記載のあった因果関係の判定について、今後調べてゆきたいと思います。

重ねて、ご回答ありがとうございました。

お礼日時:2009/01/08 00:57

 私は、相関係数を算出する相関分析と、予想のための式を求める回帰分析を分けています。

相関分析には、横軸の原因となるものと縦軸の結果と想定するものに、因果関係を要求します。回帰式は、予想値が的中すれば、因果関係は要求しません。
 ですから、この場合は、相関分析に相当します。

>統計学的に私の主張は正しいと言えるのでしょうか?
統計学的な方法自体は、正しいと考えます。しかし、相関分析の目的である因果関係の検証がなされていません。

 すなわち、因果関係の成立には、時間性、密接性、特異性、普遍性、そして合理性の5要件の全てを満たす、あるいは矛盾しない、ことが必要です。この5要件については、7要件、9要件、という学者もいます。この検証がなされていません。
 その内容については、テキストを読んでいただければ、分るような文章にはななていますが、具体的な判定方法を書いていないので、私は悪戦苦闘しました。

 ご質問の場合、まず特異性に問題がありそう。というのも、売上に最も関係しそうなのは、資産よりも価格だと推定されるからです。あるいは、店員の態度の方が、より影響するように感じます。このように、要因が多いものは、特異性を満たさず、その取扱いには要注意。みかけの相関、すなわち、擬相関の場合が少なくありません。総資産なんぞは、実際に買う場合に、知っている人は少ないでしょう。すなわち、直接的な効果があるとは想えないのですが、総資産が売り上げに何故関与するのか、説明できるでしょうか。

 密接性についても、決定係数が0.2では小さすぎる。ただ、データ数を多くすれば、有意差は出やすくなりますが、決定係数は小さくなるのは事実です。

 時間性については、売上があがると、総資産が増える、すなわち、因果関係が逆である、ことも想定できます。

 普遍性、合理性については、何ら証明がありません。

 以上のことから、統計学的な主張はできるが、目的とされている因果関係の主張には、不十分です。
 ただ単純に考えると、総資産が多い、すなわち、でかい会社ほど売り上げが多いのは当然、と思いますが。
 

この回答への補足

 早速に、ご丁寧なご回答を戴き、誠にありがとうございます。
 相関分析と回帰分析の区別をあまり考えていなかったように感じます。ご指摘ありがとうございます。
 追加の質問で恐縮ですが、もう少しご助力をお願いできますでしょうか。

【相関分析について】
 私の主張したいことは、横軸x(例えば総資産)の増加に伴い、縦軸y(例えば売上高)も増加する傾向にある、という内容です。いわば、右上がりのベクトル・方向性を示したい、ということです。今後のデータ予測を行う必要はありません。
 この主張は、2つのデータの因果関係の検証と相関分析で統計的に検証できる内容でしょうか。
 つまり、私なりに理解しますと、「データ間の因果関係を検証した後(内容に矛盾がないことが前提ですが)、相関分析を行い、有意な正の相関関係が示されれば、私の主張は統計学的に間違っていない」と考えて宜しいのでしょうか。
 
 統計学の教科書を読みますと「xの増加に伴ってyが増加する関係を正の相関という」との内容でしたので、正の相関関係が示されれば良いのかな、と考えています。

 ご多用中、恐縮ですがご教示くださいますようお願い申し上げます。

補足日時:2008/12/24 23:15
    • good
    • 0

科学的な価値観とビジネス的な価値観は大きく異なるということ。

それを前提に話しましょう。

まずは科学的な立場から:

> R2は0.2程度でした。

決定係数が0.2程度ということは、その回帰直線(回帰分析の結果)はデータのほとんどを説明できていない、つまり当てはまりが悪いということがいえます。

> 相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。

帰無仮説「母相関係数は0である」ということについて検定したわけ。有意であったからといって、それはあくまで相関係数は0ではないということが明らかになっただけで、強い相関関係があるかどうかは別問題。それは相関係数を見て判断しなければならない。

> 回帰係数も検定したところ、1%水準で有意な関係、との結果でした。

帰無仮説「推定した偏回帰係数は0である」という仮説を検定する。これも相関係数と同様。

したがって、

> 相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しい

という主張は(統計学をやったことのある人からすると)かなり無茶な言い分といわれるかもしれません。相関係数が0.80とかで有意ならば納得できますが、決定係数が0.2程度ということは、相関係数はせいぜい0.30とか?あるいは散布しているデータポイントは曲線関係が見られるとか? そういう疑問がわきます。

ビジネス的な観点から:

全く統計を知らない素人相手を丸め込もうとするなら、(たとえその分析がチンプンカンプンなものであっても)散布図に直線を当てはめた図を見せ、数式や分散分析表を見せて「統計学的に解析したらAとBには相関関係が認められ、この回帰方程式で***の予測が可能です」などといえば、反論できないでしょう(^_^;)

統計は道具ですから、それをどう使うかは自由。それらしいものを提示して相手を上手く丸め込めるのなら、それだけでもやる価値はあるというものです。ただそういうのは、学術の場では御法度。
    • good
    • 0
この回答へのお礼

ご丁寧なご回答を戴きありがとうございます。
また、ビジネス的観点からもご指摘を戴き、感謝申し上げます。

ご指摘の通り、私の考え方は有意性の検定に固執していた感があります。
大変勉強になりました。ありがとうございます。

もし、もう少しご助力を戴けるなら、2番様に記載した追加質問にもご助言いただけますと幸いです。

お礼日時:2008/12/24 23:14

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!