最近機械学習、統計学の勉強をしているのですが、パラメータという言葉をよく見ます。このパラメータの定義に関していまいちわかっていないので教えてください。
調べてみると、パラメータの定義は
「母集団を要約する値、母集団の確率分布が決まっている場合、そのパラメータがわかると分布の形が一意に決定される。パラメータは固定された唯一の値であり、確率変数ではない。」
とありました。
例えばマンションの家賃であれば、「駅からの距離」、「階数」、「部屋の広さ」などと多くの説明変数を用いて回帰できると思います。この場合、各説明変数に対する係数は唯一の定数という風に解釈できます。(異なるマンションの家賃を推定しようとしても、各説明変数に対する係数は共通であるため)
しかし、正規分布について考えたとき、パラメータはμとσの2つで説明変数はxだと思います。
パラメータμ、σを決定すると、正規分布は一意に決まることは理解できますが、μ、σの値自体は様々な値がとれるので唯一の定数ではないように思ってしまいます。
説明が難しく言っている意味が分からないかもしれませんが、要するにパラメータの定義を初学者にもわかりやすく教えていただきたいです。
また、
y = β0 + β1x1 + β2x2 + β3(x2^2)
といった簡単な式であれば、特徴量はx1, x2, x2^2でパラメータはβ0~β3とわかりますが、
https://qiita.com/shinjikato/items/9c336d2cf25aa …
↑のページに記載されているような、説明変数xを様々な形で変換している複雑な式の場合、パラメータはどのようにして判断すればよいでしょうか。
No.3ベストアンサー
- 回答日時:
どんな複雑な式であっても、定式化するために解いた定数の数(リンク先のケースではxの係数の数)がモデルパラメータ数です。
蛇足ですが、普通は、あんなオーバーフィッティングのような式は作りません。
観測値をピタッと通る曲線は作れますが、観測値が誤差を持っていたら、その後の予測は怪しくなるからです。
No.2
- 回答日時:
> パラメータμ、σを決定すると、正規分布は一意に決まることは理解できますが、
> μ、σの値自体は様々な値がとれるので唯一の定数ではないように思ってしまいます。
パラメータμ、σが唯一の定数だというのは、
それを決定すると正規分布は一意に決まるというのと同じこと。
μ、σが異なる値をとると、そのパラメータを持つ正規分布は
別の正規分布になる。
パラメータμ、σが唯一というのは、
ひとつの正規分布に対してはただひとつの値だということだ。
ひとつの正規分布からは複数のインスタンスをとることができるが、
異なるインスタンス(説明変数の異なる値)に対して
それが同じ分布からとったものであれば
パラメータμ、σの値は共通だということ。
No.1
- 回答日時:
パラメータには、
・モデルパラメータ
・ハイパーパラメータ
があります。
機械学習では、ハイパーパラメータが登場するので、混乱します。
モデルパラメータは、分析モデルを定義するパラメータで、正規分布ならガウスの誤差関数の定数であるμとσ、回帰モデルなら、β0~βpです。
モデルを定式化するために解きたい値です。
ハイパーパラメータ(超パラメータ)とは、モデルパラメータを決めているパラメータです。
これは、過学習にならないように、調整弁として働くパラメータです。
クロスバリデーションを用いて値を決めます。
ハイパーパラメータは、例えば正則化回帰lassoでは、罰則値λ。この値により回帰係数は変わります。
サポートベクターマシンであれば、ソフトマージンを与えるσ。この値により識別境界は変わります。
なお、リンクして頂いたHPは遺伝的アルゴリズムなので、ここで使われるパラメータは意味がちょっと違います。遺伝的アルゴリズムはパラメータは、
・人口
・突然変異率
など、たくさんのパラメータを設定しますが、これは探索点xを動かすための「条件値」であり、xを代入して得られた結果y(これは定式化したモデルを使用します)に基づき、より良い方向に探索を進める働きをしています。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- Chrome(クローム) Chromeの描画領域を2分割して異なるスクロール位置を同時に表示させることはできますか 1 2023/03/01 16:53
- 統計学 複数の母集団から別の母集団の規模を推定する方法 3 2022/12/28 07:06
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- その他(プログラミング・Web制作) 下記内容はpythonの重回帰分析で可能でしょうか? python初心者です。現在の業務でもしかした 2 2022/06/16 00:36
- 統計学 ARMAモデルが適用できる状態について 1 2022/12/30 05:58
- 物理学 大学物理に詳しい方に質問です。 ラザフォードたちが実験で知りたかったことは衝突パラメータbと原子核の 1 2023/03/16 03:39
- 統計学 最近統計学について独学で勉強している者です。 mとnは二つの母集団から無作為抽出した際の標本のサイズ 2 2023/02/07 12:35
- 統計学 統計学の問題 2 2022/07/24 19:57
- 数学 参考文献の探し方(数学) 1 2022/07/19 01:09
- 数学 フーリエ変換後の負の周波数成分の扱いについて 4 2022/09/03 10:18
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
統計でいう「n」は、何の略な...
-
N数?n数?サンプル数の「エヌ...
-
統計学-母集団が少ない場合の...
-
評価者により採点に差が出るこ...
-
有意差があってもサンプルサイ...
-
モデルのパラメータの定義がい...
-
t検定のt値について
-
信頼区間から標準偏差の求め方
-
ある集団の平均身長を調べたい....
-
多数決 統計学に詳しい方教え...
-
エクセルで「集団から最大値、...
-
適正なサンプル数について
-
大至急お願い致します!統計学...
-
統計 基準値の標準偏差はなぜ1か
-
統計学における無作為抽出に関...
-
時系列データの検定
-
t検定って何ですか
-
【統計学の問題】サイコロの出...
-
一つ一つの重さを計るのと10...
-
アンケート調査に必要なサンプル数
おすすめ情報
ご回答ありがとうございます。
パラメータには種類があること、パラメータという言い方が同じなだけで意味合いが異なる場合があること把握いたしました。
リンク先のサイトでは遺伝的プログラミングで複雑な関数を生成していますが、情報量基準AICを求めようとするとパラメータの数が必要になってくると思います。
例えばこのリンク先の複雑な関数のAICを求めようとすると、AICを求めるうえでのモデルパラメータはどれを指して、パラメータ数はどのようにカウントすればよいのでしょうか。
回帰式が単純な多項式などであればパラメータ数はカウントできそうですが、このような複雑な式になった場合の考え方を教えていただきたいです。