プロが教える店舗&オフィスのセキュリティ対策術

今、数千件のデータを解析しています。

ヒストグラムから、それぞれの時点のデータが正規分布に従うことが分かりましたので、母集団も正規分布に従う、という仮定の下で話を進めます。

各時点での平均と標準偏差をプロットしたところ、右上がりの一次関数になり、一定の値にはなりませんでした。

そこで、このような場合(標本平均も標本分散も一定の値にならない)、どうやって全体の母集団のパラメータを推定するのでしょうか。

教えてください。

A 回答 (1件)

もし、各時点の分布が正規分布で、その平均と標準偏差が時間の一次関数なら、すべての時間を寄せ集めた分布は、正規分布になりません。

さらに言えば、時間が無限に続いていくとき、平均が発散してしまいます。それでも、全体の平均と標準偏差を計算したいのでしょうか?

ご質問のような状況のときは、確率過程(とくに加法過程)の言葉で記述するのが普通のように思います。
時間をtで表し、t時点の値をXtとします。すると、「平均と標準偏差が時間の一次関数」の前提の下で、

 Xt = aYt + bt + c

と表すことができます。Ytは、標準正規分布に従う確率変数です。ここで、Xtの振舞を記述するには、次の値を推計することが主要目標になります。

(1)a、b、cの値
(2)Cov(Yt, Yt-s) -∞≦s≦∞

実践的には、もし、異なるtどうしでXtが独立なら、a、b、cは、最小2乗法で推計できます。そうでなければ、ARIMAモデルに当てはめる方法があります。

ネットで、「確率過程」、「正規加法過程」、「Wiener過程」、「時系列分析」、「自己回帰モデル」、「ARIMAモデル」などのキーワードで検索すると、参考になるサイトが見つかるかもしれません。
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!