アプリ版:「スタンプのみでお礼する」機能のリリースについて

Excelを用いてノイズデータの解析をしています。
時刻1~1200(1/2秒)間にノイズデータを1200点取得し、区間を設定しfrequency関数から頻度分布を求め、区間を横軸、分布を縦軸に取りグラフにしました。
ノイズは2.0から3.0までの値をランダムにとっており、区間は2.0から0.05ずつ3.0までの合計20区間をとりました。
そのグラフに各区間に対するガウス分布の値をnormdist関数によって求め、追加しました。
normdist関数の計算の際用いた平均値と標準偏差はそれぞれ2.35、1.38を基準に適当に決めております。
これは何故なのでしょうか。(関数形式は確率分布なのでtrueを用いています。)
また、頻度分布をO、normdist関数によって求めた各区間に対するガウス分布の面積、つまり期待値をE、dを区間数から自由度3を引いたもの(つまり20-3=17)とすると、X^2=1/d(Σ(O-E)^2/E)で求められるX^2の値が1程度なら十分にガウス分布のデータをよくあらわしているというのですが、これはどういう意味なのでしょうか。
先程の適当に設定した平均値と標準偏差を適当に変え、X^2の値が1程度になればよいという指摘を受けたのですが、全く意味がわかりません。
どなたか、ご教授ください。

A 回答 (1件)

この話は統計学の適合度検定の話だと思うのですが、


幾つかエクセルの使い方にも問題があるようです。
(記載ミスなら良いですが)

normdist関数は確率密度で使う場合はfalseではないでしょうか。

カイ2乗値の計算は期待度数と観測度数の差の2乗値を期待度数で
割ったもので計算するのでEはnormdistで計算した密度に件数
(1200点)をかけたものになります。
 χ^2=Σ(O-E)^2/E
質問にあるようにdで割っている理由は良く分かりません。

適合度検定ではこのχ^2の値により分布の適合度を検定します。
その際の自由度は20区分なら20-1=19です。(何故17なのかは不明)
自由度は和(1200点)により制約されているので1減ります。

これを優位水準5%位で検定するとχ^2値が10くらいということに
なりますので、その意味で1くらいというアバウトな話になるの
ではと推測します。(あくまで推測です。正しくは上記の手順で
行ないます。)

最後に、分布のパラメータを求める際には通常は最小二乗法など
を用いてパラメータ推定を行い、その結果を用いてχ2乗検定を行
なうというのが正しい流れです。つまり、最小二乗法により求め
られた分布がデータに適合しているかどうかを検定するというこ
とになります。
今の場合は1次元データなので、その平均と標準偏差を計算して
それを用いるということになるかと思いますが。。。

適合度検定は例えば以下のサイトを参考にして下さい。
http://oweb.u-shizuoka-ken.ac.jp/~tateyama/lectu …

参考URL:http://oweb.u-shizuoka-ken.ac.jp/~tateyama/lectu …
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!