dポイントプレゼントキャンペーン実施中!

最適な近似曲線を引く際に、明らかに誤差とされるデータを除いた上で行ないたいと考えています。

つまり、散布図のようなプロットに近似曲線を引いたとき、
極端にその近似曲線から外れているとされるデータを抽出し、削除する方法を探しています。

例えば、
X 1 2 3 4 5
Y 1 3 100 7 9
のとき、三番目のYのみを削除し、求めたい近似曲線に最適化したいです。

回答よろしくお願いします。

A 回答 (1件)

よく使われる手順としては、以下のような方法があるかと思います。


1. 最初に全部のデータを使って、近似を行い、各点の近似曲線からのずれを計算する。
2. 標準偏差σを計算する。
3. ずれが3σより大きなデータは、異常データとして除外する。
4. ずれの大きなデータを除外した残りのデータで改めて近似曲線を作る。
ここで留意しないといけないのは、データの除外は一度だけ行う(上記の操作を何度も繰り返して行わない。)ことかと思います。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!