統計解析において、クロスバリデーション法でRMSEなど算出する際、
分割数がサンプル数と等しいleave one out法であればRMSEの結果は常に同じですが
そうでない場合、毎回計算結果が異なりますよね。
例えば2foldのときと3foldのときで計算結果は異なりますが、
2foldで固定した場合でもその分割の仕方をランダムにすれば当然結果はその都度異なりますが
その際RMSEの値は何回か計算した場合の平均値としてよいのでしょうか?
同じ2foldでも1回目の計算ではRMSEがそれなりに小さくなるが、
2回目の計算ではかなり大きくなってしまったりすると
それを平均したり、はたまた良い方の結果を採用するのは不適切ですよね?
計算結果がその都度大幅に変わってしまうときは
モデルとして精度が低いということなのでしょうか。
初歩的なことですが、よろしくお願いいたします。
No.1ベストアンサー
- 回答日時:
resampling では普段 bootstrapping を使っており、cross validation は理屈だけわかってるつもりながら実務経験がほとんどない者です。
詳しい人が答えてくれるだろうと思っていたら回答が付かないので、しゃしゃり出ました。参考程度に考えてください。> RMSEの値は何回か計算した場合の平均値としてよいのでしょうか?
良いです。
> 平均したり、はたまた良い方の結果を採用するのは不適切ですよね?
良い方の結果を採用するのは論外ですけど、平均は妥当です。cross validation は予測誤差の分布を推定していて、その分布は通常、平均と標準偏差を持つと考えるのが自然ですから。
> 計算結果がその都度大幅に変わってしまうときはモデルとして精度が低いということなのでしょうか。
計算結果が予測誤差の標準偏差を指し「モデルとして精度が低い」とは「予測が当たらない」という意味なら、そのとおりです。普通の意味の精度である「母数の推定量の分散の逆数」ではありません。
なお、英語版 wiki の resampling
http://en.wikipedia.org/wiki/Resampling_(statist …
からの link 先である日本語版
http://ja.wikipedia.org/wiki/リサンプリング
は、統計でいわゆる resampling の説明ではありません。
ついでながら、resampling を理解するには推定量(確率変数)と推定値(実現値)をはっきり区別するのが大切と思います。
ur2c様
ご回答ありがとうございます!
もう誰にも回答いただけないと諦めていました。
RMSEは平均値で妥当とのことですっきりできました。
統計の基礎的なところから、勉強したいと思います。
どうもありがとうございました!
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 不偏分散を計算するときに標準偏差和をn-1で割りますが、なぜ-1なのでしょうか? 「なぜnでなくn- 5 2022/07/04 14:54
- 数学 賃料と専有面積のデータが60部屋分ほどがあり、 賃料÷専有面積(=1㎡あたりの賃料)の数式で計算する 2 2023/02/18 20:33
- その他(Microsoft Office) Excelで時間計算(負) 8 2023/02/26 05:47
- Chrome(クローム) Chromeの描画領域を2分割して異なるスクロール位置を同時に表示させることはできますか 1 2023/03/01 16:53
- 建設業・製造業 土量算出 3 2022/09/26 19:57
- 統計学 標準誤差の求め方 2 2022/07/04 19:59
- Excel(エクセル) エクセルのSUM関数について 4 2023/04/18 10:37
- 統計学 統計学、エクセルがわかりません!解答と詳しい解説をお願いします! (1)それぞれの地域別に記述統計量 9 2022/08/21 16:30
- C言語・C++・C# C言語 3 2022/10/04 15:07
- 数学 WolfarmAlpha計算機 計算結果がおかしい 2 2022/07/02 15:42
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
3割の計算
-
信頼区間90%は何σ?
-
減少率計算式教えて下さい
-
倍率とデシベルの計算式
-
2の128乗の計算方法
-
電力ケーブルのインピーダンス...
-
らせんRの計算の仕方
-
常用対数の求め方 log10の2は約...
-
「再帰的」の意味を教えてください
-
1.01の12乗の計算
-
1512の1/5乗
-
10^0.2 = 1.58489319246111の計...
-
電卓の機能の名称が分からない...
-
三角形の面積・・・ヘロンと座...
-
2次関数って何の仕事で必要な...
-
三角関数って
-
計算ソフトでの計算精度について
-
尺数での坪数計算
-
中3の有効数字の範囲の問題で √...
-
計算の方法を教えてください。 ...
おすすめ情報