指数関数のカーブフィッティング

Question

時間ｔに対する１ｃｈデータ列ｙがありまして、それを
ｙ＝ａ　ｅｘｐ（ｂ　ｔ）　＋　ｃ
に対して客観的に、できれば自動的にフィッティングして、ａ，ｂ，ｃを求めたいです。
これがただの1次関数の最小二乗法ならわかりますし、ｃが既知なら１次関数の応用で、というところまでもわかります。恥ずかしながら渡井には非線形最小二乗法を一般論で理解して解けるような気がしません。

Excelを使った最小二乗法手順説明サイト
http://szksrv.isc.chubu.ac.jp/lms/lms2.html
のような方法か、
C/C++のプログラム
http://www.sist.ac.jp/~suganuma/kougi/other_lecture/SE/predict/predict.htm#2
のようなアルゴリズムの説明をいただけると大変ありがたいです。

よろしくお願いします。

htms42 · Accepted Answer

回答が寄せられていませんので考えてみました。
ヒントになれば幸いです。

最小二乗法は直線に当てはめる場合の方法です。
ｙ－ｃ＝ａｅｘｐ（ｂｔ）
の両辺の対数を取ると
ｌｎ（ｙーｃ）＝ｌｎ（ａ）＋ｂｔ
です。ｃが分かればできるのだがと書かれているのはこの式のことですね。
ならばｃを推定する手順を入れたらと考えました。

時系列ｔ１、ｔ２、ｔ３、・・・が等間隔とします。
ｌｎ（ｙ２－ｃ）－ｌｎ（ｙ１－ｃ）＝ｂ（ｔ２－ｔ１）＝ｂτ
ｌｎ（ｙ３－ｃ）－ｌｎ（ｙ２－ｃ）＝ｂ（ｔ３－ｔ２）＝ｂτ
ｌｎ（ｙ４－ｃ）－ｌｎ（ｙ３－ｃ）＝ｂ（ｔ４－ｔ３）＝ｂτ

（ｙ２－ｃ）／（ｙ１－ｃ）＝ｋ
（ｙ３－ｃ）／（ｙ２－ｃ）＝ｋ
（ｙ４－ｃ）／（ｙ３－ｃ）＝ｋ

（ｙｎ－ｃ）は等比数列になっているはずです。
ｙ１、ｙ２、ｙ３に対して
（ｙ２－ｃ）／（ｙ１－ｃ）＝（ｙ３－ｃ）／（ｙ２－ｃ）
より
ｃ＝(ｙ１ｙ３-ｙ２＾２）／（ｙ１＋ｙ３－２ｙ２）
が決まります。
ｙ２、ｙ３、ｙ４に対しては
ｃ＝(ｙ２ｙ４-ｙ３＾２）／（ｙ１＋ｙ４－２ｙ３）
が決まります。
データがばらついていますからこのｃもばらつきます。
さしあたり平均で推定していいのではないでしょうか。この値を計算して平均を求めるアルゴリズムはやさしいはずです。
全データでなくて一部でやっても構わないはずです。時間が等間隔でなければ等間隔の部分を抜き出してやればいいです。ｃの分布の幅も押さえておくといいでしょう。後でｃを修正するときに必要になります。

ｃの値が推定できればｌｎ（ｙ－ｃ）とｔのグラフを作って最小二乗法でａ、ｂが決まります。もし適合の指標のような値も同時に得られるのでしたら少しｃの値を動かして比べてみるといいと思います。ｃの分布の幅が分かっているとｃの値を動かす目安になります。平均でやったのとあまり違わなければ平均でもいいということになります。

ご質問を見て考えたものです。素人っぽい考えかたです。

foobar · Answer

最小自乗法を使うときにはいくつか留意点があるかと思います。

y=Aexp(Bx)に最小自乗法でフィッティングさせるとき、
y=Aexp(Bx)をそのまま使う場合と、
log y=logA+Bxの形にして最小自乗法を適用するときで、
AとBの値に違いができます。
logyで計算すると、log y とフィッティング曲線との差が均等化されるため、yが大きなところでの誤差が（実数のグラフで見ると）大きくなります。
特に、減衰してゆくデータで、十分減衰して0付近になったデータが多いと、A,Bの推定値がここの部分に引っ張られてしまう可能性があります。

どういうデータに適用するか、推定したA,Bをどのように使うかにも寄りますが、場合によっては、直接 y=Aexp(Bx)の形で、数値計算的にA,Bを求めるほうがよい場合があります。

たとえば、
a)A,B,Cの値の初期値を決める（Cは十分減衰したところのデータの平均値、A,Bはlog(y-C)=logA+Bxの形で最小自乗法により決定）
b)e0=Σ(y0-y)^2を計算　（y0はAexp(Bx)+Cの値）
c)Aを微小量(正負)変えて、同様にe1,e2を計算。
d)e0,e1,e2から誤差が最小になるAの値を推定
e)B,Cについても同様に新しい値を推定
f)A,B,Cが所定の誤差内に収まるまで、b)からe)を繰り返す。
みたいな手法もあります。（最初の初期値のとり方がまずいと変な値を出す可能性があるとか、dの推定の手順がまずいと数値が振動して収束しない、計算終了の判断条件をどうするか、といった問題点がありますが）

htms42 · Answer

＞今のところ収束するまでデータをとっているので、収束後の平均値でｃを求めて（ｙ－ｃ）のデータ列を作り直して・・・

収束が起こる現象を見ているだろうというのに気がつきませんでした。
ｂ＜０になっているということですね。減衰曲線です。
でも考えてみれば当然ですね。ｂ＞０の発散の場合、測定範囲が広すぎて対応できないはずです。
式は初めから
ｙ＝ａｅｘｐ（－ｂｔ）＋ｃ　　
として考えるほうがいいですね。

ふと思ったのですが指数関数的に収束するという事に対する裏付けはあるのでしょうか。これは着目している現象の中での測定量の性質として決まってくるはずのものですね。一応確めておく必要があると思います。
収束する関数は指数関数だけでは有りません。データのばらつきが大きければどういうカーブにでも合わせることが出来ます。どういう式に従って収束するかは理論的に予測しておく必要があります。

１／ｔ^(n)で減衰する場合は
ｙ＝ａ／ｔ^(n)＋ｃ　
です。
ｌｏｇ（ｙ－ｃ）＝ｌｏｇａ－ｎｌｏｇｔ
となります。

手作業でやるときは半対数方眼紙を使うか両対数方眼紙を使うかの違いになります。いきなり機械に計算させてしまうのでははなくて一度図示するという判断のプロセスを入れるというのも大事なことでしょう。「自動計算」を考えておられますのでちょっと気になりました。

htms42 · Answer

＃１です。

途中ミスタイプがあるのに気がつきました。
念のため、訂正しておきます。

（誤）「ｙ２、ｙ３、ｙ４に対しては
ｃ＝(ｙ２ｙ４-ｙ３＾２）／（ｙ１＋ｙ４－２ｙ３）
が決まります。」

（正）「ｙ２、ｙ３、ｙ４に対しては
ｃ＝(ｙ２ｙ４-ｙ３＾２）／（ｙ２＋ｙ４－２ｙ３）
が決まります。」

指数関数のカーブフィッティング

回答が寄せられていませんので考えてみました。

最小自乗法を使うときにはいくつか留意点があるかと思います。

＞今のところ収束するまでデータをとっているので、収束後の平均値でｃを求めて（ｙ－ｃ）のデータ列を作り直して・・・

＃１です。

似たような質問が見つかりました

このQ&Aを見た人はこんなQ&Aも見ています

関連するカテゴリからQ&Aを探す

このQ&Aを見た人がよく見るQ&A

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング