こんにちは。
統計について質問させていただきます。
10,000個のデータ(平均値5.4E-05、標準偏差2.5E-04)を
ヒストグラムに変換したところ、その分布形が対数正規分布とみなせそうです。
そこで、ks検定で分布形の推定を行っているのですが、ヒストグラムに対応しそうな
確率密度関数(pdf)と累積分布関数(cdf)の算出が分からず困っております。
ここ何日か、書籍やネットなどで調べてみたものの、何度やってもうまくいきません・・・。
ヒストグラムのデータ区間が小さすぎるのが問題ではないかと考えておりますが。
恥ずかしながら、統計学に関してはあまり学んだことがありませんので、
言葉足らで分かりにくいかと思いますが、
どなたか詳しい方、説明して頂けませんでしょうか。
少しでも分かりやすいように、画像を添付しておきます。
よろしくお願いいたします。
A 回答 (2件)
- 最新から表示
- 回答順に表示
No.2
- 回答日時:
> なので,度数分布に変換し,その数値データを用いてアンダーソン・ダーリン検定やダゴスティーノ・パーソン検定を行って,対数分布であることは確認はできたのですが.
対数正規分布であることは確認できたのですよね?
ならば、さらにks検定(コルモゴロフ-スミルノフ検定のことですよね)までする必要はないと思いますが…
> 今は,エクセルで正規化した平均値-9.8と標準偏差0.43を用いて
> pdf=NORMDIST(LN(1.0E-05~2.0E-04),-9.8,0.43,FALSE)/1.0E-05~2.0E-04
> としているのですが,
pdfの計算は間違っていないようです。
> それぞれのpdfの値が1を超えてしまい,
pdfの値、即ち確率密度は1を超えてもおかしくないですよ。
> 合計すると2.0E+05にまでなってしまいます.
この合計はただ単に各pdfを足してしまったからでしょうね。
級の幅をかけてやらないと駄目です。
級の幅は1E-05のようですから計算してみると……、2になってしまいますね。
計算誤差が原因なのかもしれませんが、ExcelにはLOGNORMDIST 関数或いはLOGNORM.DIST 関数があるのでこちらを使用してみてはいかがでしょうか。
この回答への補足
回答ありがとうございます.
pdfについては勘違いをしていました.
pdfの積分=1になるはずですね.
どうもご親切にありがとうございました.
なんとかなりそうなので,とりあえず自力でやってみます.
ありがとうございました.
No.1
- 回答日時:
> そこで、ks検定で分布形の推定を行っているのですが、ヒストグラムに対応しそうな
確率密度関数(pdf)と累積分布関数(cdf)の算出が分からず困っております。
ひょっとして、対数正規分布のパラメータを色々変更しても棄却されてしまうという状況でしょうか?
もしそうなら、データ数が10,000個と多数なので棄却されるのは当然でしょうね。
つまり、データ数が多ければ多いほど検出力が高くなるので、少しの違いでも分布が異なると判断されてしまいます。
なので対応方針としては、有意水準を厳しくするか、検定を行わず対数変換したデータについて正規確率プロットを描き目視で判断するか、対数正規分布とみなさずそのまま経験分布として使用する方法が考えられます。
この回答への補足
回答ありがとうございます.
実際には棄却されてしまう以前の問題でして・・・
ks検定を行う場合,データをそのまま用いると思うのですが,
そこで使用する累積分布関数の算出法が分からず,判定まで持ち込めません.
なので,度数分布に変換し,その数値データを用いてアンダーソン・ダーリン検定や
ダゴスティーノ・パーソン検定を行って,対数分布であることは確認はできたのですが.
pdf,cdfの算出に,平均値5.4E-05や標準偏差2.5E-05のような極めて小さい値に対しても,
1.0E-05~2.0E-04の範囲で対数分布が描けるものなのかと疑問を持っております.
可能であるならば,その数式を教えて頂きたいのですが・・・
今は,エクセルで正規化した平均値-9.8と標準偏差0.43を用いて
pdf=NORMDIST(LN(1.0E-05~2.0E-04),-9.8,0.43,FALSE)/1.0E-05~2.0E-04
としているのですが,それぞれのpdfの値が1を超えてしまい,合計すると2.0E+05にまで
なってしまいます.
間違えている点ありましたらご指摘よろしくお願いいたします.
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 数学 ヒストスプライン平滑化をする際の節点の決め方ついて教えてください。 9 2022/08/08 16:17
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- C言語・C++・C# このプログラミング誰か教えてくれませんか 1 2022/06/02 15:27
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 統計学、エクセルがわかりません!解答と詳しい解説をお願いします! (1)それぞれの地域別に記述統計量 9 2022/08/21 16:30
- 数学 至急!次の問題を教えてください。 ある市では、消防車の出動要請が平均して1時間当たり1回ある。 多く 2 2022/11/18 20:25
- 統計学 統計学の問題です よろしくお願いします 区間推定 母集団は正規分布に従い,母分散は σ2 = 112 1 2023/01/31 18:57
- 統計学 統計検定2級の過去問について 1 2023/01/04 16:40
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
統計学的に信頼できるサンプル...
-
調査結果は、標準誤差率が何%...
-
効果量のマイナス表示に関して
-
T検定とF検定
-
サンプルサイズが極端に少ない...
-
統計学 P値
-
T検定とMann-WhitneyのU検定の...
-
t-検定(P<0.05で有意差あり):p...
-
平均値、標準偏差、変動係数に...
-
統計解析、検定手法(Cochran-M...
-
割合の差の検定について教えて...
-
統計学 3群間の比較
-
母集団の平均が求まらないとき...
-
T検定 pの値がなんか変なんです
-
統計学 正規分布と対数正規分...
-
重回帰分析のF検定を教えてく...
-
有意差
-
統計についての質問です。
-
t検定・Χ二乗検定について t...
-
適合度の検定の時、カイ二乗値 ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
効果量のマイナス表示に関して
-
統計学的に信頼できるサンプル...
-
調査結果は、標準誤差率が何%...
-
p値の計算式
-
T検定とMann-WhitneyのU検定の...
-
英語論文に出てくる「independe...
-
統計学のP検定とt検定につい...
-
有意差が無いことを証明(危険...
-
サンプルサイズが極端に少ない...
-
サンプルサイズの大きく違うF検定
-
データの分析方法
-
統計のt検定について
-
検定で出てしまった有意差を認...
-
Excelでスミルノフ・グラッブス...
-
スミルノフ・グラブス検定の有...
-
母集団の違う2つの平均値の優...
-
この実験研究に必要な標本人数...
-
2群間平均の差の検定 差が“な...
-
Mann-WhitneyのU検定をspss統計...
-
SPSSで次のようなデータについ...
おすすめ情報