あなたの習慣について教えてください!!

統計初心者です。PLSで統計解析をしています。

前処理として、通常センタリングとスケーリングをする必要がありますが、

トレーニングデータでは全て同じ値をとる変数(すなわち分散が0)でも、

テストデータでは異なる値を取る変数がある場合、

トレーニングデータのモデル構築をどのようにすればいいのでしょうか・・。

その変数に関してはスケーリングができませんが、

モデルの変数として組み込みたい場合です。

初歩的な質問とは思いますが、どなたかご教授いただけますでしょうか。

宜しくお願い申し上げます。

A 回答 (1件)

トレーニングデータで全く同じ値なら、たとえ説明変数としてモデルとして組み込んでも、(トレーニングがうまくいけば)結果として構築される回帰モデルでは、完全に無視されることになるはずです。


なんで、モデルの変数として組み込んでも意味ない、としか言いようがないですけどね。

あえてやるなら、トレーニングデータでとりあえずモデルを作った後、
オンライン学習できるようなアルゴリズムにして、テストデータを使って予測をしながら、モデルを修正する、とかですかね。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!