ママのスキンケアのお悩みにおすすめアイテム

なぜデータ予測の手法には、線形回帰や決定木など様々な手法があるんでしょうか?
もっと表現力の高い、どんな関係でも表せる手法がひとつあればOKということにはならないんでしょうか?

A 回答 (2件)

企業で統計・データ解析を担当する者です。



1つにはならないでしょう。
理由は、それぞれに得手不得手があるからです。

さて、今は予測のためのモデルを「サロゲート・モデル」(代理モデル)と呼びます。

あなたの言われる様々な方法は、発展の歴史です。
・一般線形モデル
・一般化線形モデル
・一般化加法モデル
と発展してきました。これらは予測式を与える方法です。

それに対して、決定木やSVMのような分類器を使った回帰は分類器回帰と言われ、等高線を与えます。分類器は識別境界を与えますから、y=0に相当する境界線、y=1、y=2、とやっていけばp次元空間の等高線が作れて、そこから予測が可能になります。かなり自由度は高い(等高線はグネグネで不等間隔)ですよね。ただし、大量のデータが必要であり、データ量が少ない時は過学習に気を付けなければいけません。

ここにさらに誤差の仮定を入れる必要があり、種々のモデル化手法が出てきています。薄板スプラインとかクリギングといったノンパラメトリックな手法です。しかし、これらのモデル化手法には得手不得手(例えばピークが尖がるとか)がありますので、ひとつって訳にはいきません。

データサイエンスと銘打って、最初に線形回帰を教えているセミナーがありますが、これが混乱の元です。最初に歴史を示して、到達点をはっきりさせれば、ご質問者のような疑問は無くなると思います。

ところで、決定木は、統計ソフトで予測はできますが上に述べたように予測式は出てきません。さて、これを装置の制御ソフトに実装するときはどうすれば良いでしょう。意外と世間のテキストには書いてないんですよね。

このときは、空間の全格子点をあらかじめ計算し、これを実装します。運用時は代入値のk近傍点を使って重み付き平均を取るなどして計算します。これが面倒なので、予測式が与えられる方法を使う場合もあります。
    • good
    • 3
この回答へのお礼

助かりました

詳しくありがとうございます!

お礼日時:2020/05/01 11:26

どんな関係でも表せる手法・・未来予知ですね。

    • good
    • 1
この回答へのお礼

Yes

ありがとうございます!

お礼日時:2020/05/01 11:27

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


このQ&Aを見た人がよく見るQ&A

このカテゴリの人気Q&Aランキング