手元に200個(大きさ200;行数200)の観測データがあり、その一部(n個)を用いて回帰モデルを構築した場合の予測精度が、用いたデータ数nにどのように依存するかを調べたいと考えています。
このような場合、次の(1)~(3)を、様々なnについて繰り返す方法でよいのでしょうか?
(1)200個のデータをランダムに、大きさn, (200-n)の2つの部分集合に分ける
(2)前者を用いて構築した回帰モデルで後者を予測する
(3)予測誤差を評価する
不安な点は、nに応じて、予測されるデータ数(精度検証に用いられるデータ数)が変化してしまうことです。
何かコメントをいただければ幸いです。
No.1ベストアンサー
- 回答日時:
もし予測精度を評価するための基準としてy=ax+bという回帰式のaとbというパラメータの標準誤差が、aとbの値の推定に使ったn数にどう依存するのかをシミュレーションで調べるのでよければ、次の方法(bootstrap)はいかがでしょうか:
(1)200個のデータからn個のデータをランダムに復元抽出する。
(2)n個のデータに対して回帰分析を行いaとbの値を推定する。
(3)この作業をk回繰り返す(nの値は変えない)。
(4)aとbの推定値がそれぞれk個手元に残るので、そのデータからそれぞれの標準偏差を計算する。
☆この作業をnの大きさを変えて繰り返し、aとbの標準誤差のn依存性をグラフにする。
復元抽出なので、nが200でも何通りものサンプルが作れて、質問にあるような心配は生じないはずです。
この回答への補足
早速ご回答をいただきありがとうございます。
大変参考になりました。
私の今回の場合は、回帰パラメータの標準誤差ではなく、回帰式の予測誤差について、n依存性を調べたいという状況です。従って、回帰計算に用いていないデータを残しておいて、そのデータを予測し、誤差を調べることが必要かと思います。
もし仮に、1つのnについて調べるだけであれば、ランダムにn個を抽出して回帰モデルを構築し、残りの200-n個を予測して誤差を評価する操作を、多数回繰り返せばよいと思います(モンテカルロ法)。しかし、今回のように多数のnについて調べる場合は、nに応じて200-nが変化する(検証用データの数が変わる)ために、よくないのではないかという漠然とした不安を感じます。はっきりと表現できず申し訳ありません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 回帰分析検証不一致 5 2022/05/04 20:48
- 統計学 混合効果モデルについて 3 2022/05/31 21:00
- 統計学 2019年度の毎日朝6時に測定された東京都霞が関における窒素酸化物(Nox)濃度のモニタリングデータ 4 2023/04/24 16:45
- 英語 To predict the presence of recession, multivariabl 3 2022/10/22 16:19
- その他(住宅・住まい) 壁際(野外)での騒音計測について 1 2023/04/20 16:55
- その他(プログラミング・Web制作) プログラミング Python 2 2022/09/20 08:23
- 格安スマホ・SIMフリースマホ 楽天回線エリアなのかパートナーエリアなのか 2 2023/01/14 00:56
- 固定資産税・不動産取得税 固定資産税と測量データ 6 2023/06/21 13:31
- 計算機科学 エクセルのデータの表すことについて 2 2023/03/05 20:49
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
決定係数がマイナスになる例っ...
-
回帰水を売ってる会社大丈夫か
-
切片あり回帰と切片なし回帰
-
Excel分析ツールでのポアソン回...
-
修正済み決定係数(R2乗)がマ...
-
回帰式と近似式について
-
重回帰式の比較・検討について
-
独立変数(複数存在)が、従属...
-
ロジスティック回帰分析におけ...
-
相関分析と回帰分析ではどのよ...
-
線形相関係数
-
エクセル 重回帰 グラフ
-
最尤法で回帰直線の傾きと切片...
-
重回帰分析かロジスティク分析か?
-
numbersで重回帰分析をしたい
-
ダミー変数を用いた重回帰分析...
-
二つのデータの波形が似てるか...
-
相関について
-
相依相関の読みと意味を教えて...
-
相関係数の求めかたbyエクセル
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
決定係数がマイナスになる例っ...
-
切片あり回帰と切片なし回帰
-
Excel分析ツールでのポアソン回...
-
ある1点で傾きが急激に変化する...
-
回帰式と近似式について
-
修正済み決定係数(R2乗)がマ...
-
回帰水を売ってる会社大丈夫か
-
原点強制通過させたときの相関係数
-
残差について
-
numbersで重回帰分析をしたい
-
相関分析の相関係数と重回帰分...
-
Yハットの出し方やミュートと...
-
最小二乗法の傾きと切片について
-
EXCELで両対数を取った重回帰分...
-
重回帰分析・ヘドニックアプローチ
-
エクセル 重回帰 グラフ
-
重回帰分析で偏回帰係数を全て...
-
統計用語の和訳について
-
four-parameter近似式の求め方
-
残差グラフについて、何故説明...
おすすめ情報