重要なお知らせ

「教えて! goo」は2025年9月17日(水)をもちまして、サービスを終了いたします。詳細はこちら>

電子書籍の厳選無料作品が豊富!

移動平均線の区間数の選び方について教えてほしいです。
大学の研究でデータをまとめる必要があります。

約4500秒の間の実験における散布図で移動平均線を用いたいのですが、
区間数を決め、そしてその区間数にした理由を言いなさいと言われました。


この場合どういう基準で区間数を決めたほうが良いでしょうか?

A 回答 (2件)

どういう基準にすべきかは、ご自分で考えていただくしかない。


 「散布図」とは言いながら「約4500秒の間の実験」で得たデータであり、「区間数」だの「移動平均」だの言ってるということは、一定の時間間隔Δtごとに取られた離散的なカーブ f(nΔt) ではないかと推測します。さらに、各サンプルの値 f(nΔt) (n=0,1,…)に含まれる偶然誤差(ノイズ)の標準偏差σ がnによらず一定であるとか、fに比例するとか、何らか理論的な予想がつけられるんじゃありませんかね。(たとえば、「σ がnによらずfに比例する」というのなら、fの代わりにその対数を使えば log((1+ε)f) = log(f) + log(1+ε) ≒ log(f) + ε なので「σ がnによらず一定である」という状態になります。)

 で、「σ がnによらず一定」だとすると、連続する2k+1個のサンプル の平均s(nΔt)
  s(nΔt) = (1/(2k+1)) Σ f((n+j)Δt)  (Σはj=-k,…,kの総和)
を作れば、sの標準偏差は σ/√(1/(2k+1)) になる。なので、時間分解能を悪くする代わりに、データに含まれるノイズを抑制できるわけで、これが平滑化ということです。

 では、時間分解能をどこまで下げて良いか。言い換えればノイズをどこまで許すか。これは、実験の目的と、データのノイズレベルによるんで、これらを勘案してどういう基準にすべきかを、ご自分で考えるしかないな。

 ところで、そもそも移動平均が賢明な選択なのかどうか、というところに疑問がありますね。適当な線形フィルタを使う方がスマートでしょう。
 ことにデータのはじめの部分と最後の部分は平滑化が効きにくい。なので、もし両端に重要な情報があるんなら、移動平均はあんまり旨い手ではない。ちなみに、移動平均というのは、実際に採れたデータの前後に2k個ずつデータ"0"を追加したものに、線形フィルタとして幅(2k+1)の矩形関数を作用させる、ということと同等であり、矩形関数のフーリエ変換が (sin(ω))/ω)であることからわかる通り、高周波成分はそれなりに残ってしまいます。
    • good
    • 0

サンプリング間隔やデータの傾向によるのでは?


あとは、落としたい周波数とか
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!