統計に関する質問です。
私は勤務先(金融)で特定の業種の財務分析をしているのですが、データの分析方法(回帰分析)で分からない点があります。
具体的には下記の通りです。
【状況】
ある業種業界について、2つのデータ(例えば、総資産と売上高)を収集しました。
データは5年間分をパネルとして扱っており、総数は400くらいです。
2つのデータ間に何らかの関係をあると考え、総資産を横軸、売上高を縦軸、としてエクセルで散布図を作成したところ、右上がりの関係があるように感じました。
エクセルの機能で近似値線(直線)を引いて、算式とR2を表示したところ、算式の傾きはプラスで、R2は0.2程度でした。
その後、回帰分析を行い、分散分析表を作成しました。
相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。
回帰係数も検定したところ、1%水準で有意な関係、との結果でした。
【私の主張】
私は「統計学的に考えて、総資産の増加に伴い売上高が増加する傾向がある」と述べたいのですが、
(なお、背景にある理論は別途構築しており、業界内でも理解が得られると思われます。)
【ご質問】
1. 回帰分析の結果から、回帰直線の傾きがプラスで、相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しいと言えるのでしょうか?評価は個人ですべきものだとは存じますが、考え方・説明方法に無理があればご教示をお願い申し上げます。
2. もし、上記1の質問が的外れであれば、どのような点がおかしいのでしょうか。ご教示いただきますようお願い申し上げます。
抽象的な部分もございますが、何卒ご教示のほど、お願い申し上げます。
【前提】
上記は私の職務柄、個人で利用する目的で作業を行っています。
論文その他レポートの作成を目的としておりません。
No.3ベストアンサー
- 回答日時:
No2です。
>相関分析と回帰分析
私は分けた方が考えやすいので区別していますが、教科書的ではありません。
>私の考え方は有意性の検定に固執していた感があります。
推測統計学(推計学)では、有意差が無いと、何も言えません。ですから、固執するべきです。
>横軸x(例えば総資産)の増加に伴い、縦軸y(例えば売上高)も増加する傾向にある、という内容です。
これだと、相関係数に有意差があり、回帰式の回帰係数が正であれば十分です。誰も異論は唱えられません。ですから、No2で、「統計学的な方法自体は、正しいと考えます。」と回答しました。
>「xの増加に伴ってyが増加する関係を正の相関という」との内容でしたので、正の相関関係が示されれば良いのかな、と考えています。
統計学の教科書は、それで十分です。しかし、実際に(=社会的に)応用するには、因果関係の検証が必要で、それに関する記述は、統計学の教科書にはありません。
すなわち、相関の場合、因果関係が無いと、見かけ上の関係、すなわち擬相関の問題が生じます。私の研究課題である平均寿命で例にとります。
世界各国の新聞の発行部数と平均寿命には、決定係数が0.6はあります。すなわち、強い正の相関があるので、統計学的には「新聞を読めば、健康に関する知識が増えるので、平均寿命が伸びる」を主張できます。しかし、新聞を読んだくらいで寿命が伸びるとは考えられません。それなら、病院を潰して、その費用を新聞に回せば良いのです。因果関係がないと、実社会では誤った結論に陥りかねない、ということです。これを見かけだけの相関、擬相関といいます。
株の話は、どうでしょう。株価の変動で、直線的に右上がりのグラフを良く見ます。すなわち、回帰式は、右上がりです。相関も強い正でしょう。
しかし、横軸は年月です。年月と株価に因果関係があるのなら、この回帰式は、常に成立します。しかし、現実は暴落。これは因果関係がないからです。
>「データ間の因果関係を検証した後(内容に矛盾がないことが前提ですが)、相関分析を行い、有意な正の相関関係が示されれば、私の主張は統計学的に間違っていない」と考えて宜しいのでしょうか。
私の順序は、
1) 相関係数を算出する
2) 相関係数とデータ数から、有意差を見出す。
3) 因果関係の5要件について、その全てを満たしていることを示す。
5要件の一つの判定に、私は相関係数を使うので、2)は3)より先にします。
この5要件の判定が、実は厄介です。その最大の理由は、教科書に分ったように書いてあるが(政治家に似て、表現は美しいが)、実は何にも分らない(具体的な判定法を書いていない)。例えば、密接性だと、「強固な関連があること」と書いてあったりします。強固か否かの判定法は、書いてありません。密接性の判定には、相関係数を利用しています。悪戦苦闘した所以です。
因果関係の判定は、ご自身で経験を積んで下さい。
ご回答を戴きまして誠にありがとうございました。
お礼が遅くなりまして申し訳ございません。
ご記載のあった因果関係の判定について、今後調べてゆきたいと思います。
重ねて、ご回答ありがとうございました。
No.2
- 回答日時:
私は、相関係数を算出する相関分析と、予想のための式を求める回帰分析を分けています。
相関分析には、横軸の原因となるものと縦軸の結果と想定するものに、因果関係を要求します。回帰式は、予想値が的中すれば、因果関係は要求しません。ですから、この場合は、相関分析に相当します。
>統計学的に私の主張は正しいと言えるのでしょうか?
統計学的な方法自体は、正しいと考えます。しかし、相関分析の目的である因果関係の検証がなされていません。
すなわち、因果関係の成立には、時間性、密接性、特異性、普遍性、そして合理性の5要件の全てを満たす、あるいは矛盾しない、ことが必要です。この5要件については、7要件、9要件、という学者もいます。この検証がなされていません。
その内容については、テキストを読んでいただければ、分るような文章にはななていますが、具体的な判定方法を書いていないので、私は悪戦苦闘しました。
ご質問の場合、まず特異性に問題がありそう。というのも、売上に最も関係しそうなのは、資産よりも価格だと推定されるからです。あるいは、店員の態度の方が、より影響するように感じます。このように、要因が多いものは、特異性を満たさず、その取扱いには要注意。みかけの相関、すなわち、擬相関の場合が少なくありません。総資産なんぞは、実際に買う場合に、知っている人は少ないでしょう。すなわち、直接的な効果があるとは想えないのですが、総資産が売り上げに何故関与するのか、説明できるでしょうか。
密接性についても、決定係数が0.2では小さすぎる。ただ、データ数を多くすれば、有意差は出やすくなりますが、決定係数は小さくなるのは事実です。
時間性については、売上があがると、総資産が増える、すなわち、因果関係が逆である、ことも想定できます。
普遍性、合理性については、何ら証明がありません。
以上のことから、統計学的な主張はできるが、目的とされている因果関係の主張には、不十分です。
ただ単純に考えると、総資産が多い、すなわち、でかい会社ほど売り上げが多いのは当然、と思いますが。
この回答への補足
早速に、ご丁寧なご回答を戴き、誠にありがとうございます。
相関分析と回帰分析の区別をあまり考えていなかったように感じます。ご指摘ありがとうございます。
追加の質問で恐縮ですが、もう少しご助力をお願いできますでしょうか。
【相関分析について】
私の主張したいことは、横軸x(例えば総資産)の増加に伴い、縦軸y(例えば売上高)も増加する傾向にある、という内容です。いわば、右上がりのベクトル・方向性を示したい、ということです。今後のデータ予測を行う必要はありません。
この主張は、2つのデータの因果関係の検証と相関分析で統計的に検証できる内容でしょうか。
つまり、私なりに理解しますと、「データ間の因果関係を検証した後(内容に矛盾がないことが前提ですが)、相関分析を行い、有意な正の相関関係が示されれば、私の主張は統計学的に間違っていない」と考えて宜しいのでしょうか。
統計学の教科書を読みますと「xの増加に伴ってyが増加する関係を正の相関という」との内容でしたので、正の相関関係が示されれば良いのかな、と考えています。
ご多用中、恐縮ですがご教示くださいますようお願い申し上げます。
No.1
- 回答日時:
科学的な価値観とビジネス的な価値観は大きく異なるということ。
それを前提に話しましょう。まずは科学的な立場から:
> R2は0.2程度でした。
決定係数が0.2程度ということは、その回帰直線(回帰分析の結果)はデータのほとんどを説明できていない、つまり当てはまりが悪いということがいえます。
> 相関係数の有意性を検定したところ、1%水準で有意な関係、となりました。
帰無仮説「母相関係数は0である」ということについて検定したわけ。有意であったからといって、それはあくまで相関係数は0ではないということが明らかになっただけで、強い相関関係があるかどうかは別問題。それは相関係数を見て判断しなければならない。
> 回帰係数も検定したところ、1%水準で有意な関係、との結果でした。
帰無仮説「推定した偏回帰係数は0である」という仮説を検定する。これも相関係数と同様。
したがって、
> 相関係数の関係が1%の有意水準で有意であることから、統計学的に私の主張は正しい
という主張は(統計学をやったことのある人からすると)かなり無茶な言い分といわれるかもしれません。相関係数が0.80とかで有意ならば納得できますが、決定係数が0.2程度ということは、相関係数はせいぜい0.30とか?あるいは散布しているデータポイントは曲線関係が見られるとか? そういう疑問がわきます。
ビジネス的な観点から:
全く統計を知らない素人相手を丸め込もうとするなら、(たとえその分析がチンプンカンプンなものであっても)散布図に直線を当てはめた図を見せ、数式や分散分析表を見せて「統計学的に解析したらAとBには相関関係が認められ、この回帰方程式で***の予測が可能です」などといえば、反論できないでしょう(^_^;)
統計は道具ですから、それをどう使うかは自由。それらしいものを提示して相手を上手く丸め込めるのなら、それだけでもやる価値はあるというものです。ただそういうのは、学術の場では御法度。
ご丁寧なご回答を戴きありがとうございます。
また、ビジネス的観点からもご指摘を戴き、感謝申し上げます。
ご指摘の通り、私の考え方は有意性の検定に固執していた感があります。
大変勉強になりました。ありがとうございます。
もし、もう少しご助力を戴けるなら、2番様に記載した追加質問にもご助言いただけますと幸いです。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 学業成績に関する重回帰分析の見方について 4 2022/06/06 17:19
- 統計学 回帰分析検証不一致 5 2022/05/04 20:48
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 宇宙科学・天文学・天気 AIが答えた方程式 1 2023/02/20 00:12
- 大学・短大 大学 統計学 2 2022/09/18 15:06
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 心理学 卒業論文の分析について 1 2022/09/05 14:19
- 統計学 アンケート調査のデータ比較をする際の統計分析方法の選択に迷っています 5 2022/04/15 01:05
- 経済学 因子分析における因子得点の解釈について 1 2022/12/10 02:05
- その他(Microsoft Office) ピボットテーブルへの集計フィールド挿入 1 2023/02/26 11:33
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
回帰分析についてわかる方…
-
ロジスティック回帰分析のモデ...
-
重相関係数R2と有意F値(p値)に...
-
単回帰分析の結果(説明)の書き方
-
ダミー変数の中心化について
-
相関係数,寄与率の記号につい...
-
共分散分析(ANCOVA)で...
-
重回帰分析(多重共線性)について
-
重回帰分析(OLS)の係数の比較...
-
非線形モデル回帰分析の前提条件
-
Excel 分析ツールの回帰分析の...
-
回帰分析に使うデータの加工
-
ダミー変数だけによる重回帰分析
-
課題で、ワードで2枚程度という...
-
経済学のレポートで扱いやすい論題
-
大学のレポートとか課題って生...
-
大学の課題の提出に3分遅れてし...
-
一般的に、遅れた課題をメール...
-
大学生です。自己剽窃について...
-
単位を懸けた重要なレポートの...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
エクセルでのシグモイドのカー...
-
2変数のばらつき具合をはかる方...
-
単変量解析から多変量解析時の...
-
回帰分析って何ですか?
-
単回帰分析の結果(説明)の書き方
-
回帰分析で「有意な相関がある...
-
Excel 分析ツールの回帰分析の...
-
EXCELの分析ツールの標準残差とは
-
【統計 回帰分析 ダミー変数に...
-
ダミー変数だけによる重回帰分析
-
回帰分析の論文の書き方につい...
-
EXCELで線形自己回帰分析どこま...
-
SPSS17で二項ロジスティック回...
-
エクセルでの重回帰分析
-
ダミー変数について
-
エクセル統計での単変量解析の仕方
-
重相関係数R2と有意F値(p値)に...
-
ダミー変数の中心化について
-
【統計】テストの弁別力について
-
2変量の単調増加性の検定について
おすすめ情報