ある実験データがあり、正規分布に近い形をしています。しかし近いとはいえ、少々ズレているため分散と平均値を求め正規分布の曲線を実験データに重ねて描くと、、、なぜか大幅にずれてます。原因は、平均から大きく離れたところにデータが少ないとはいえポツポツとあり、分散が大きくなるからです(平均値はほぼ正しい値と思われます)。
分散を求める際に正規分布おかまいなく求めるため過大になるのかと思い、正規分布にfittingしようと考えました。つまり最小二乗法により実験データに近い正規分布を求め、分散を求めるのです。
この方法は意味ありますか?おそらく太古の昔から用いられてるような誰でも思い付く方法と思いますが。。。また、実際に計算する場合、エクセル等で関数は用意されてますか?それともlogを取り2次関数に展開しfittingする必要がありますか?
A 回答 (6件)
- 最新から表示
- 回答順に表示
No.6
- 回答日時:
> 正規分布にフィッティング
「(データを)正規分布にフィッティングする」という表現は意味をなしていません。強いて解釈するなら「正規分布に従うようなウソのデータを作為的にでっち上げる」というほどの意味になるでしょうか。
さて、ご質問が、「データの散布図に正規分布をフィッティングする」という話なのだとすると、その操作は統計学的・確率論的に解釈しようがなく、まるでナンセンスです。
しかし「データの分布に正規分布をフィッティングする」ということ、あるいは、「データの散布図にガウス曲線をフィッティングする」ということなら意味があります。両者は全く別の話であって、前者は、データの(散布図ではなく)度数分布図を描いておいて、これにガウス曲線をフィッティングすることによって、データの分布を正規分布で近似する、という意味です。また、後者は確率分布とは何の関係もなくて、単に散布図をある曲線で近似する。その曲線がたまたまガウス曲線である、ということです。
なので、ご質問はおそらくこのどちらかではないかと思います。
●前者の場合、具体的にやることはただデータの平均と分散を計算するだけ。結果として得られた正規分布が度数分布図の形とまるで似ていないのなら、そのフィッティングは無理である。つまり、「データは正規分布とは異なる分布に従っている」ということを意味しています。
●また、後者、すなわち、ある実験データ(x[i], y[i]) (i=1,2,...., N)があり、その散布図が正規分布の曲線(ガウス曲線)近い形をしている。そこで、データにガウス曲線
f(x, a, b, c, d) = a exp(-((x-b)/c)^2)
をフィッティングしたい、すなわち、fの定数a, b, cを適当に調節して、
f(x[i], a, b, c,) ≒ y[i]
となるようにしたい、というお尋ねであるなら、たとえば「非線形最小二乗法」というやりかたで数値計算を行えば「ある意味で最適な」a, b, cを算出することができます。この場合、曲線fが散布図上の点(x[i],[y[i])の近くを通るようにするのであって、曲線fは確率とは関係ないのだから、当然、分散だの平均だのも全く関係ありません。
No.4
- 回答日時:
なんか、やたら標準化すればいいような話なってますが、違うと思います。
問題は何をしらべたいか?
そのために、どういう仮定を置くかということで、正規分布なんて、理想的なものに、世の中がそうなってるわけがない。
大事なのは、何をいいたいか? どういう主張をするかです。それによっては、正規性を必要としない議論もあるわけです。
逆になんでも標準化は感心しません。これはデータ自身の情報を損ねます。
まず、なにを言いたいのか? なにを法則として主張するのか? それが大事です。
No.3
- 回答日時:
実験データを標準化し、それが標準正規分布に従っているか、どうかを見た方がいいんじゃないでしょうか?
「分散が大きくなるからです」とおっしゃっているということは標準化されていませんよね?
標準化するとは、実験データを平均μ=ゼロ、標準偏差σ=1の枠にあてはめることです。
それには各実験データを、(実験データ -μ)÷σという式に入れます。
これはExcelならSTANDARDIZE関数で計算できます。
それによって得られる値の分布が、標準正規分布(μ=ゼロ,σ=1)にどれくらい似ているか検証すればいいのだと思います。
No.1
- 回答日時:
論理的にある正規分布になるべきだとされているものを証明するための実験であれば、あまり意味は見出せないね。
逆に、偏差が小さくなる正規分布にfitする論理的理由を見つけ出すために行うのであれば、行っても良いのかもしれないね。 除外してしまいたいデータがあるんだろうけど、除外する正当な理由を見つけ出すことができないってことだとすると、無理にfitする必要はないかもしれないね。何のための実験で、どのような結論を期待しているかによるということだね。
ありがとうございます。
正規分布の証明ではなく、正規分布であることが前提です。しかし描かせるとズレが大きい、分散が誤ってるのではないか?分散が大きい理由が、分散の計算方法が正規分布を前提にしてないためではないか?と思ったのです。
無理にfitする必要がないのはどうしてでしょうか。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 数学 以下の数学の問題を教えてください。 確率変数Xは標準正規分布N(0、1)に確率変数Yは平均3のポアソ 3 2022/12/02 19:13
- 統計学 統計学 二項分布の正規近似について 2 2023/02/10 11:58
- 統計学 統計学の問題です。 数学 51 49 23 77 78 56 44 37 7 29 80 61 36 1 2023/02/03 15:24
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- 数学 数学の答えと解き方を教えてください。 問:ある(人数の非常に多い)集団から無作為に6名を選んで身長を 4 2022/12/14 10:06
- 統計学 統計学 最大値の標準偏差 15 2023/02/02 18:36
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 数学 高校の数学Bの、確率分布と統計的な推測の、 正規分布の問題でわからない箇所がございます。問題文が、 2 2022/03/27 20:57
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
「未使用」と「不使用」ってど...
-
PCの内蔵メモリにデータは残る?
-
日本通信の当月利用データ量は...
-
高速フーリエ変換でデータ数が...
-
データ用HDDの別のPCへの乗せ替え
-
XMLデータってなんですか?
-
パレート図等で「N=100」とあ...
-
Excelの“並び替え”で文字コード...
-
排他的論理和の問題
-
ExcelデータのMacとWindowsの文...
-
【MSOffice Publisher2010差し...
-
差し込み印刷がうまくできません
-
Android Google でなく Bing検...
-
プロ野球の球団別の残塁数を載...
-
B2ポスターとのA4チラシを同じ...
-
Rについての質問です。 Rを使い...
-
印刷キューに表示されるサイズ...
-
送信バイト数とはなんですか?
-
エクセル2010 VBA Date型のグラ...
-
Excel ドロップダウンリスト(入...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
「未使用」と「不使用」ってど...
-
高速フーリエ変換でデータ数が...
-
PCの内蔵メモリにデータは残る?
-
パレート図等で「N=100」とあ...
-
ネットカフェから、メールでき...
-
下記マクロでMsgBox "空白です...
-
Excelの“並び替え”で文字コード...
-
XMLデータってなんですか?
-
Excel Webクエリ
-
データ用HDDの別のPCへの乗せ替え
-
エクセルのグラフのデータ系列...
-
職務質問で聞かれたデータはど...
-
時代はSSDなのにネットの最近の...
-
日本通信の当月利用データ量は...
-
ワードの差し込み印刷のデータ...
-
プロ野球の球団別の残塁数を載...
-
シリアルRS-232出力機器からの...
-
差し込み印刷がうまくできません
-
Excel ドロップダウンリスト(入...
-
表計算: 多次元の表を作りたい
おすすめ情報