ある実験データがあり、正規分布に近い形をしています。しかし近いとはいえ、少々ズレているため分散と平均値を求め正規分布の曲線を実験データに重ねて描くと、、、なぜか大幅にずれてます。原因は、平均から大きく離れたところにデータが少ないとはいえポツポツとあり、分散が大きくなるからです(平均値はほぼ正しい値と思われます)。
分散を求める際に正規分布おかまいなく求めるため過大になるのかと思い、正規分布にfittingしようと考えました。つまり最小二乗法により実験データに近い正規分布を求め、分散を求めるのです。
この方法は意味ありますか?おそらく太古の昔から用いられてるような誰でも思い付く方法と思いますが。。。また、実際に計算する場合、エクセル等で関数は用意されてますか?それともlogを取り2次関数に展開しfittingする必要がありますか?
A 回答 (6件)
- 最新から表示
- 回答順に表示
No.6
- 回答日時:
> 正規分布にフィッティング
「(データを)正規分布にフィッティングする」という表現は意味をなしていません。強いて解釈するなら「正規分布に従うようなウソのデータを作為的にでっち上げる」というほどの意味になるでしょうか。
さて、ご質問が、「データの散布図に正規分布をフィッティングする」という話なのだとすると、その操作は統計学的・確率論的に解釈しようがなく、まるでナンセンスです。
しかし「データの分布に正規分布をフィッティングする」ということ、あるいは、「データの散布図にガウス曲線をフィッティングする」ということなら意味があります。両者は全く別の話であって、前者は、データの(散布図ではなく)度数分布図を描いておいて、これにガウス曲線をフィッティングすることによって、データの分布を正規分布で近似する、という意味です。また、後者は確率分布とは何の関係もなくて、単に散布図をある曲線で近似する。その曲線がたまたまガウス曲線である、ということです。
なので、ご質問はおそらくこのどちらかではないかと思います。
●前者の場合、具体的にやることはただデータの平均と分散を計算するだけ。結果として得られた正規分布が度数分布図の形とまるで似ていないのなら、そのフィッティングは無理である。つまり、「データは正規分布とは異なる分布に従っている」ということを意味しています。
●また、後者、すなわち、ある実験データ(x[i], y[i]) (i=1,2,...., N)があり、その散布図が正規分布の曲線(ガウス曲線)近い形をしている。そこで、データにガウス曲線
f(x, a, b, c, d) = a exp(-((x-b)/c)^2)
をフィッティングしたい、すなわち、fの定数a, b, cを適当に調節して、
f(x[i], a, b, c,) ≒ y[i]
となるようにしたい、というお尋ねであるなら、たとえば「非線形最小二乗法」というやりかたで数値計算を行えば「ある意味で最適な」a, b, cを算出することができます。この場合、曲線fが散布図上の点(x[i],[y[i])の近くを通るようにするのであって、曲線fは確率とは関係ないのだから、当然、分散だの平均だのも全く関係ありません。
No.4
- 回答日時:
なんか、やたら標準化すればいいような話なってますが、違うと思います。
問題は何をしらべたいか?
そのために、どういう仮定を置くかということで、正規分布なんて、理想的なものに、世の中がそうなってるわけがない。
大事なのは、何をいいたいか? どういう主張をするかです。それによっては、正規性を必要としない議論もあるわけです。
逆になんでも標準化は感心しません。これはデータ自身の情報を損ねます。
まず、なにを言いたいのか? なにを法則として主張するのか? それが大事です。
No.3
- 回答日時:
実験データを標準化し、それが標準正規分布に従っているか、どうかを見た方がいいんじゃないでしょうか?
「分散が大きくなるからです」とおっしゃっているということは標準化されていませんよね?
標準化するとは、実験データを平均μ=ゼロ、標準偏差σ=1の枠にあてはめることです。
それには各実験データを、(実験データ -μ)÷σという式に入れます。
これはExcelならSTANDARDIZE関数で計算できます。
それによって得られる値の分布が、標準正規分布(μ=ゼロ,σ=1)にどれくらい似ているか検証すればいいのだと思います。
No.1
- 回答日時:
論理的にある正規分布になるべきだとされているものを証明するための実験であれば、あまり意味は見出せないね。
逆に、偏差が小さくなる正規分布にfitする論理的理由を見つけ出すために行うのであれば、行っても良いのかもしれないね。 除外してしまいたいデータがあるんだろうけど、除外する正当な理由を見つけ出すことができないってことだとすると、無理にfitする必要はないかもしれないね。何のための実験で、どのような結論を期待しているかによるということだね。
ありがとうございます。
正規分布の証明ではなく、正規分布であることが前提です。しかし描かせるとズレが大きい、分散が誤ってるのではないか?分散が大きい理由が、分散の計算方法が正規分布を前提にしてないためではないか?と思ったのです。
無理にfitする必要がないのはどうしてでしょうか。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
- ・漫画をレンタルでお得に読める!
- ・【大喜利】【投稿~11/12】 急に朝起こしてきた母親に言われた一言とは?
- ・好きな和訳タイトルを教えてください
- ・うちのカレーにはこれが入ってる!って食材ありますか?
- ・好きな「お肉」は?
- ・あなたは何にトキメキますか?
- ・おすすめのモーニング・朝食メニューを教えて!
- ・「覚え間違い」を教えてください!
- ・とっておきの手土産を教えて
- ・「平成」を感じるもの
- ・秘密基地、どこに作った?
- ・【お題】NEW演歌
- ・カンパ〜イ!←最初の1杯目、なに頼む?
- ・一回も披露したことのない豆知識
- ・これ何て呼びますか
- ・チョコミントアイス
- ・初めて自分の家と他人の家が違う、と意識した時
- ・「これはヤバかったな」という遅刻エピソード
- ・これ何て呼びますか Part2
- ・許せない心理テスト
- ・この人頭いいなと思ったエピソード
- ・牛、豚、鶏、どれか一つ食べられなくなるとしたら?
- ・あなたの習慣について教えてください!!
- ・ハマっている「お菓子」を教えて!
- ・高校三年生の合唱祭で何を歌いましたか?
- ・【大喜利】【投稿~11/1】 存在しそうで存在しないモノマネ芸人の名前を教えてください
- ・好きなおでんの具材ドラフト会議しましょう
- ・餃子を食べるとき、何をつけますか?
- ・あなたの「必」の書き順を教えてください
- ・ギリギリ行けるお一人様のライン
- ・10代と話して驚いたこと
- ・家の中でのこだわりスペースはどこですか?
- ・つい集めてしまうものはなんですか?
- ・自分のセンスや笑いの好みに影響を受けた作品を教えて
- ・【お題】引っかけ問題(締め切り10月27日(日)23時)
- ・大人になっても苦手な食べ物、ありますか?
- ・14歳の自分に衝撃の事実を告げてください
- ・架空の映画のネタバレレビュー
- ・「お昼の放送」の思い出
- ・昨日見た夢を教えて下さい
- ・ちょっと先の未来クイズ第4問
- ・【大喜利】【投稿~10/21(月)】買ったばかりの自転車を分解してひと言
- ・メモのコツを教えてください!
- ・CDの保有枚数を教えてください
- ・ホテルを選ぶとき、これだけは譲れない条件TOP3は?
- ・家・車以外で、人生で一番奮発した買い物
- ・人生最悪の忘れ物
- ・【コナン30周年】嘘でしょ!?と思った○○周年を教えて【ハルヒ20周年】
- ・あなたの習慣について教えてください!!
- ・都道府県穴埋めゲーム
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
「未使用」と「不使用」ってど...
-
XMLデータってなんですか?
-
インスタの設定について。 イン...
-
PCの内蔵メモリにデータは残る?
-
高速フーリエ変換でデータ数が...
-
日本通信の当月利用データ量は...
-
データ用HDDの別のPCへの乗せ替え
-
エクセルで縦に並んだデータを...
-
【MSOffice Publisher2010差し...
-
Excelの“並び替え”で文字コード...
-
ネットカフェから、メールでき...
-
VGA出力をキャプチャする方法を...
-
Excel グラフで数値の正と負の...
-
表計算: 多次元の表を作りたい
-
CSVファイルを・…
-
窓関数(方形窓)について
-
フーリエ変換のデータの補間に...
-
パレート図等で「N=100」とあ...
-
正規化(時間)
-
ワードの差し込み印刷のデータ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
「未使用」と「不使用」ってど...
-
高速フーリエ変換でデータ数が...
-
日本通信の当月利用データ量は...
-
XMLデータってなんですか?
-
ネットカフェから、メールでき...
-
PCの内蔵メモリにデータは残る?
-
パレート図等で「N=100」とあ...
-
データ用HDDの別のPCへの乗せ替え
-
インスタの設定について。 イン...
-
エクセルで縦に並んだデータを...
-
Excel Webクエリ
-
【MSOffice Publisher2010差し...
-
ワードの差し込み印刷のデータ...
-
エクセルのグラフのデータ系列...
-
Excelの“並び替え”で文字コード...
-
フラッシュメモリ SSD、USB、SD...
-
職務質問で聞かれたデータはど...
-
窓関数(方形窓)について
-
表計算: 多次元の表を作りたい
-
差し込み印刷がうまくできません
おすすめ情報