レポートで重回帰分析を用いた実証分析を行っているのですが、重回帰分析に関しての質問があります。
内容としては、企業のコスト構造に一定の費用関数を推定し、コストを被説明変数、その他の説明変数を複数推定して、そのパラメーター(2~3つ)を重回帰分析で求めるもの内容となっています。
財務データを年代順に収集し、上記の分析方法で計測したところ、分析結果(推定式)のR2はデータ量が増加しても良好に推移しています。
ところが、複数ある説明変数の一部のP値が、1%⇒5%⇒10%・・・と、どんどん大きくなってしまい、説明変数として有意でなくなってしまいました。
【質問1】
データ量の増加とともにP値が大きくなるのは、データ量の増加に伴い推定式における当該説明変数の説明力が減少した(有力な説明変数でなくなっている)、という理解でよいのでしょうか?
【質問2】
P値の説明力を維持する(P値が大きくならないようにする)方法はあるのでしょうか?
以上です。
知識のある方には愚問かも知れませんが、何卒よろしくご回答をお願い致します。
No.2ベストアンサー
- 回答日時:
事情は分りました。
【質問1】統計学では、データ数が増えるほど有意差は出やすい、というのが原則です。単相関だと、p<0.05の水準で、データ数が10だと相関係数は0.57以上ですが、100もあると0.19。相関係数が0.19の散布図を見れば、てんでバラバラ。関係あるとは思えないような図です。重回帰は、単回帰の延長なので、原則は同じのハズ。
この原則に反するのは、多重共線性の問題が考えられます。説明変数どうしの相関が、0.5程度でも引っかかるようです。どれくらいだとクリアできるのかは、知りません。
【質問2】データがあれば、正しい方法はひとつしかないので、それに則って計算する限り、ありません。データを捏造するなどなら可。
p値を重視されていますが、No1にも書きましたように、これから言えるのは、「有意差がある」→ それをつかっても、間違いである確率は、5%以下、ということのみ。
回帰式の目的は、どれくらい予想(推定値である従属変数)を的中させるか、でしょう。この場合は、両者の関係の強さを説明するrを1に近づけるのが適切。ただ、rは、データ数が増えると小さくなります。
一番は、多重共線性に配慮しながら、説明変数を増やすこと。そうすれば、rの値は、1に近づきます。それは、曖昧さ(回帰式との距離)が少なくなるからです。教科書的には、説明変数を増やして、その変数についてF検定をして、p<0.05なら採用、そうでなければ排除、と書いてあります。が、私は、rの値が少しでも1に近づくので、排除しません。
丁寧なご回答を戴き、誠にありがとうございました。
p値に関するご見識は大変参考になりました。ご指摘の通り、教科書的な定義に固執している感がありました。参考にさせて戴きます。
No.3
- 回答日時:
【質問1】
推定期間や費用関数の関数形に依存する話なので一概に判断できません。
固定的な費用関数で、データ数(年次や四半期)を増やしても、推定期間が長くなりすぎれば、当てはまりが悪くなる事も考えられます。
実際に経済の実証分析において何らかの関数の推計を行う際に、
関数、関数形によって、適当な推計期間というのがあります。
理系の実験データなどと違い、経済の時系列データの場合は特に、単純に数を増やせば、推計の精度があがるとは限らない。
【質問2】
1.説明変数自体が長期間にわたっても適当か考える。
景気要因を除去するための稼働率などのデータを使用しているか否かなど。
労働投入は、労働者数でも短かい期間ならそれほど問題なく推計できるかも知れませんが、マクロの費用関数などでは労働者数x労働時間が説明変数になります。
2.費用関数の推計に用いている関数形をよく検討する。
ミクロの双対性理論を使えるほどデータが適当なら価格を加味するなど。
3.現在考慮されていないダミー変数などを検討する。
もし年次でバブル以前以後に渡る期間であるとかなら、バブルダミーなど。
回答ありがとうございます。
確かに、説明変数自体が時間の経過によって適当でない(有用性が変化している)場合もありますね。ご回答を参考にさせて戴きます。
No.1
- 回答日時:
>レポートで
何かの課題なら、それに回答することは、規約で禁じられています。ゼミなどの発表も、同様でしょう。指導者にがいるのなら、横から口出しするのは、マナーに反します。誰、もしくは何のためのレポートなのか、補足してください。
単回帰分析のご経験は。これにより因果関係の有無についての判断のトレーニングなしでは、説明変数の適否の判断に疑問をもちます。
また、重回帰分析については、多重共線性の問題をご理解しておられますか。さもないと、平均寿命を延ばすには、医師は増やすが看護婦は減らした方が良い、という重回帰式を導くことができます。
>データ量
データ数は耳にしますが。説明変数の数でしょうか。
それとも、同一の説明変数におけるデータ数でしょうか。同一の説明変数のデータ数の場合、相関係数rは小さくなって相関があるのかと不安になりますが、p値はむしろ小さく(回帰式は妥当であると判断される)なると想いますが。p値が0.05より大きくなり、有意差無しになるのであれば、その説明変数は不適当であり、削除すべきです。
>P値の説明力を維持する(P値が大きくならないようにする)方法はあるのでしょうか?
p値は、有意差の有無の判断に利用できるだけです。pの値が0.05でも、0.01でも、0.00001でも、統計学的な価値は、いずれも「有意差あり」と表現できるだけです。
説明力は、rの方が妥当です。rの絶対値が1.00なら説明変数がすべて、1より小さいと、他の要素が入り込んでいる、ということです。
この回答への補足
>kgu-2 さん
ご回答ありがとうございました。
大変参考になりました。
また、ご指摘の部分につき、補足致します。
>レポートについて
レポートとは、勤務先の職場内で利用するためのものであり、大学のレポートや論文関係のものではありません。言葉足らずで失礼しました。
>データ量について
ご指摘の通り、同一説明変数におけるデータ数を指しておりました。
>多重共線性について
ご指摘の通り、重回帰分析に特有の問題として認識しております。説明変数間の相関係数の大きさで検討しており、1に近いものはありませんでした。
以上です。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 マルチレベル分析について 2 2023/02/21 09:36
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 統計学 回帰分析の際の有意性検定について教えてください。 ・βk = 0 (k ∈ {1, ....,d}) 3 2023/05/04 20:25
- 大学・短大 大学 統計学 2 2022/09/18 15:06
- 統計学 ダミー変数の因子分析について質問です 1 2022/03/27 14:31
- その他(プログラミング・Web制作) 下記内容はpythonの重回帰分析で可能でしょうか? python初心者です。現在の業務でもしかした 2 2022/06/16 00:36
- 統計学 この統計の問題について教えてください 9 2023/07/04 17:02
- 統計学 回帰分析検証不一致 5 2022/05/04 20:48
- 数学 モデルのパラメータの定義がいまいちわかりません。 3 2022/10/11 15:16
- 統計学 【統計 回帰分析 ダミー変数について】回帰分析に曜日みたいなダミー変数を設定する場合って、ダミー変数 1 2023/01/14 17:00
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
ローリング回帰とはなんですか?
-
回帰分析の結果
-
クロスカントリー分析・クロス...
-
【数学・標準偏差σ】標準偏差の...
-
イケメンに生まれる確率と、金...
-
統計学の問題なんですが・・・
-
重複順列
-
4つのサイコロを同時に振って...
-
数学の問題で4C0の答えを教えて...
-
一般常識を教えてください。1割...
-
ほぼ確実って、どういう意味で...
-
5人の人々を3人と2人のグループ...
-
3σについて教えてください(基...
-
効果量のマイナス表示に関して
-
2択問題の正解確率について
-
3つのサイコロを振って出た目の...
-
P(A|B)などの読み方
-
a.b.c.d.eの5個から3個を選んで...
-
2つのサイコロの目の合計が偶数...
-
「○○通りのパターンがある」の...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
近似直線の傾き同士の相関
-
クロスカントリー分析・クロス...
-
イベントスタディ分析
-
計量経済の問題
-
重回帰分析におけるP値とデー...
-
GDP統計の「寄与度」、「寄与率」
-
回帰分析の時に対数をとる意味は?
-
因子分析における因子得点の解...
-
相関係数の特徴
-
回帰分析の際のデータの指数化
-
回帰分析の目的変数と説明変数...
-
夏に気温が上がるとビールの売...
-
統計ソフトRの重回帰分析で困っ...
-
ローリング回帰とはなんですか?
-
回帰分析:理論値と実績値の差...
-
モンテカルロシュミレーション...
-
4つのサイコロを同時に振って...
-
重複順列
-
統計学の問題なんですが・・・
-
2つのサイコロの目の合計が偶数...
おすすめ情報