No.2
- 回答日時:
機械学習は昔はパターン認識と呼ばれていた。
そういう広い意味では人工ニューラルネットの形式になっているとは限らない。もう一方は回帰分析じゃなくて回帰の話でしょう。回帰の目的は分析ではない。多数のサンプルをわずかな数のパラメータで表される簡単な関数で近似し、近似とサンプルとのずれ(残差, residue)はとりあえずノイズだと思って切り捨ててしまう。パラメータを決めるための一つの方法が最小二乗法です。機械学習においてはこれは汎化の方法です。サンプルとぴったり同じではないが大体近いデータが来たときに適切に反応できる、という能力が汎化であり、そのために近似関数を使って補間を行う。
機械学習ではパラメータの数がサンプルの数よりずっと多い、ということがしばしばあり、これは統計学の回帰分析とは大きく違う点です。その場合、最小二乗法ではパラメータの値が決まらないので、パラメータベクトルのノルムを小さくするという条件を追加する。最小ノルム最小二乗解をまともに追求する方法もあるし、残差二乗和とノルムの重み付きの和を最小化する、という方法もある。ノルムをどう定義するかもいろいろ方法があるけれども、特にパラメータベクトルの絶対値ノルムを使うことによって、パラメータの多くが0になるようにする、という手法がよく使われます。
No.3ベストアンサー
- 回答日時:
企業でSQCを推進する立場の者です。
この分野の社内講師をしています。
回帰分析が、単回帰分析を意味するのであれば、古典論でも機械学習でもβ=Sxy/Sxxで同じですが、重回帰分析になると、両者は異なってきます。
線形重回帰分析については、
・古典論は、ε(β)=Σ(yーXβ)^2 (いわゆる偏差平方和)を最小化するという基準でβを求め、
β=(XTX)^-1・XT・y という係数ベクトルが求められますが、#2さんがおっしゃっているように、Xが過飽和であるとか線形制約が入る時に、XTXの逆行列が求められず破綻します。
非線形重回帰分析では、
・残差の仮定がノンパラになりますので、上記のような最小二乗法ではなく最尤法などでβを求めます。最尤回帰、ベイズ回帰などがあります。実は古典論の中でも違いがあると言えばあるのです。
一方、
・機械学習では、ε(β)=Σ(yーXβ)^2 +λΣ|β| のように偏差平方和に対して、罰則項を課したものを最小化するという基準でβを求めます。L1正則化回帰、罰則付き回帰、スパースモデリングなどと呼ばれます。
・こうすることで、サンプルが少なく過飽和であっても、線形制約が入っていてもβベクトルが得られるようになります。
・しかし、このときβは一意に決まらず、λによって値が異なります。#2さんがおっしゃっているように汎化能力を最大化するように罰則係数λを決めてβを求めたりします。
・このL1正則化回帰は1996年スタンフォード大のチブシャアーニ先生が発表されたものですが、最近では沢山の応用が出てきていますので、ウィキペディアの「正則化」などで調べてみてください。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 中途・キャリア さて、社会人になってから13年目。 今まで、機械設計、機械製品の品質管理、部門の経営企画をやってきま 4 2023/07/17 08:59
- 統計学 加重最小二乗法=①「変数を自然対数変換」=②「誤差項の分散の逆数を重み付け」? 8 2022/11/26 11:15
- 教育・学術・研究 仕事の方向性を変えたい。経営分析→数値解析 1 2023/06/18 16:51
- 就職 昔から憧れのアクセンチュアのIT職に就きたいのですが、このスペックでも本気出せば可能性ありますか?。 4 2023/07/02 19:31
- 統計学 【統計 回帰分析 ダミー変数について】回帰分析に曜日みたいなダミー変数を設定する場合って、ダミー変数 1 2023/01/14 17:00
- その他(コンピューター・テクノロジー) 教師あり学習 1 2022/07/20 14:06
- 大人・中高年 異動願いでるべきか。行くとしたらどこか。 4 2022/05/17 05:25
- 統計学 学業成績に関する重回帰分析の見方について 4 2022/06/06 17:19
- 宇宙科学・天文学・天気 AIが答えた方程式 1 2023/02/20 00:12
- その他(職業・資格) データ分析実務スキル検定(Citizen級)学習方法 1 2022/12/18 18:44
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
応答で層別した場合の検定について
-
下の対数表示のグラフから低域...
-
検量線の決定係数について
-
極値をもつ時と持たない時、単...
-
エクセルのグラフから半値幅を...
-
心理機能診断をしたのですが、...
-
統計学の問題でわからないので...
-
統計学 カイ二乗検定とt検定の...
-
脳波(EEG)の周波数は0.5~60Hzで...
-
高校 数学 aを実数の定数とする...
-
二つのデータの分散からブール...
-
投稿論文を作成にあたり数年前...
-
心理学の統計について
-
片対数グラフと傾き・切片の出し方
-
t検定の記述の仕方を教えてくだ...
-
Excelによるサンプルの拡大につ...
-
第43回機械製図検定の解答を持...
-
大数の法則と中心極限定理の関...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
検量線の決定係数について
-
下の対数表示のグラフから低域...
-
エクセルのグラフから半値幅を...
-
x^2+y^2はどのような分布をする?
-
検定統計量の値がマイナス
-
統計について
-
【統計】有意に「高い」?「低...
-
統計学の基本的なことについて...
-
最小二乗法を反比例の式を元に...
-
心理学の統計について
-
ポアソン回帰でのカウントデー...
-
[Excel] リストからの無作為抽出
-
対数グラフの対数とは・・・?
-
極値をもつ時と持たない時、単...
-
対数目盛の読み方を教えてください
-
溶解度の問題 理科
-
正規分布について
おすすめ情報