偏差を合計するとゼロになるので、偏差の2乗を求めて、その合計から分散や標準偏差を求めていく ということを習いました。
しかし、エクセルで計算をしてみたら、偏差の合計がゼロにならずに、変な表記なりました(エラー?)。
これはなぜですか?
どなたか、詳しい解説お願いします。

このQ&Aに関連する最新のQ&A

A 回答 (3件)

#1 です。



>0にならないわけがありません

は、言いすぎでした。
 エクセルなど、コンピュータで数値処理をするときには精度の限界があるので、

-x.xxxxE-15

みたいな結果になることはあります。「変な表記」とはこのような物でしょうか?

 これは、x.xxxx かける 10の-15乗 ということで、0.000000……xxxx という、非常に小さい数値です。

コンピュータでの誤差の話については

http://oku.edu.mie-u.ac.jp/~okumura/software/exc …

などを参照してください。

ただ、これは、コンピュータの処理の限界の問題であって、「偏差を合計するとゼロになる」ということ自体に誤りはありません。
    • good
    • 0
この回答へのお礼

有難うございました。
大変参考になりました。

お礼日時:2008/06/29 22:24

こんにちは。



Excelをどう使ったか不明ですが、
それは、明らかに使い方を間違えてますね。

下記を丸写しして試してみてください。

データは、1,2,3,4,5,6,7,8,9,10 の10個です。
(平均は5.5、偏差の合計はのはずですよね。)

セルB2に 「平均」と文字記入
セルB3に =AVERAGE(D3:D12) と入力

セルD3に 「データ」 と文字記入
セルD4に 1 と入力
セルD5に 2 と入力
 ・・・・・
セルD13に 10 と入力

セルE3に 「偏差」 と文字記入
セルE4に =D4-$B$3 と入力
セルE4をセルE5~セルE13にコピー
(すると、D列の各データの偏差がE列に出現します。)

セルD15に 「偏差合計」 と文字記入
セルD16に =SUM(E4:E13) と入力
(おしまい)


ちなみに、セルE4に B3 ではなく、絶対座標の $B$3 と入力する理由は、
E5~E13を全部手で打つのが面倒くさいので、
E4からのコピーで発生させるためです。
(平均値としては、どのデータの偏差に対しても、全てセルB3を参照するので。)
    • good
    • 0

>エクセルで計算をしてみたら、偏差の合計がゼロにならずに、変な表記なりました



 どんな計算式であったか、具体的に書いてください。

 ちなみに「偏差」は、「平均値との差」ということですね?この偏差をそのまま合計すると0にならないわけがありません。
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

(聞きたいのは、最後の3行がメインです)
http://oshiete1.goo.ne.jp/qa3478996.html
の質問をしたものです。

標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」
の2種類があることはわかりました。
母標準偏差であっても標本標準偏差であっても「n」で求められる
が、標本から母標準偏差を推定するときが「n-1」を使うという
ことで理解しました。

ところで、「n」にしても「n-1」にしてもそんなに値としては
変わらないということなんですよね?

高校の時の教科書で、「標本平均(Xバー)の標準偏差」という
のがありました。
 「母平均m、母標準偏差sの母集団から大きさnの無作為標本
 抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」
というのがありました。
 「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの
は全然違うものなんですよね?(値も全然違うものになってしま
うと思います。)

Aベストアンサー

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、その標準偏差、すなわち標本標準偏差(不偏標準偏差ともいう)を代わりに用いることになります。標本は、ランダムサンプリングをするので、選ぶたびに異なり、そのバラツキは母集団とは同一の標本にはなりません
 そこで、母標準偏差はnで割るので、標本標準偏差はn-1で割っておけばやや広い範囲になるので、標本の選択が少々不味くても、広めに取ってあるのでカバーできることになります(数学的には証明できるようですが、私には無理なので、直感的に表現しました)。もちろん、標本数が大きければ、nであろうが、n-1であろうが大差はありません。このようにして、計算が非現実的な母集団のバラツキを推定するわけです。標本標準偏差は、母標準偏差の代理なのです。

>標本平均Xバーの標準偏差
 標準偏差は、母集団のバラツキを示します。標本標準偏差は、母集団のバラツキの推定値です。
 これは、標準誤差で、母集団から抽出した「標本の平均値のバラツキ」を示しています。平均ですから、再度nで割り算することになります。外国人の論文には、バラツキがグラフ上などでは小さく見えるので、標本標準偏差(母集団のバラツキの推定値)ではなく、この標準誤差(標本の平均値のバラツキ)で示したものを見かけます。

 なお、標準偏差は、英語ではStandard Deviation、エクセルではSTDEVPでPの根拠が不明。標準誤差は、英語ではPartial Standard Deviation、エクセルはSTDEVで、Patialの単語の部分が見当たりません。エクセルの関数を使うときは、逆にやりそうで、いつも混乱しています。

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、...続きを読む

Q平均値を求めない分散(標準偏差)の演算式

こんにちは。
分散は普通、平均値を求めて計算しますが、
平均値を求めず、それぞれの2乗和と和×和で演算する方法があったと思うのですが、
忘れてしまいました。

よろしくお願い致します。

Aベストアンサー

証明…
仮にxの平均をμとします
分散(σ^2)の公式
σ^2 =1/NΣ(Xj-μ)^2
=1/NΣ(Xj^2 - 2Xjμ + μ^2)
=1/N(ΣXj^2 - 2μΣXj + Σμ^2)
ここでμ=(ΣXj)/Nより
=1/N(ΣXj^2 -2Nμ^2 + μ^2)
=1/N(ΣXj^2 -Nμ^2)

ちなみに不偏分散は 1/(N-1)(ΣXj^2 -Nμ^2) です。

Q確率と平均値と標準偏差

教えてください。
確率で数値を出した場合に、その確率の値から標準偏差は出せますか?
barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。

で、標準偏差の値は平均値にそのまま足したり引いたりしたのが範囲となるのですよね?
標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?(つまり、こうすると標準偏差で出る値の半分が上限、下限となりますが)

Aベストアンサー

他の回答者の方々がおっしゃっているように、標準偏差はデータのばらつきを表すものです。
なんらかの計算をして確率を出しても、数値1個では標準偏差は出せません。
データが複数あって、平均や標準偏差が計算できます。

barはvarの誤りでしょうか。varは一般に分散を表現するキーワードですね。Excelを使っているのでしょうか?
varは(データ - データの平均値)の2乗の和をデータ数で割ったものなので、非常に大きく(データが小数点以下なら小さく)なります。

2乗のデータをそのまま足すことに意味はありません。
長さに面積を足すようなものです。
通常、varのルートを取ったものを平均に足します。
これで同じ次元のデータになります。
これが標準偏差の考え方です。

また、
      平均値±標準偏差(√分散)
はデータの最大値と最小値の範囲を指すものではありません。(通常、範囲といえば最大値と最小値の差になります)
"平均的な存在範囲"とでも表現するのが適切だと思います。

標準偏差で出た数字は範囲ですので
>標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?
という考えは合っています。
標準偏差という言葉で”平均値+標準偏差”や”平均値ー標準偏差”の値を使っている人やソフトウェアがあると、こういう風に思ってしまうのかもしれません。

(この説明では確率を単に割合として観測されたデータとして解釈しています。確率にはもっと違う意味がありますので、適当に使うと誤解を生みやすい表現になります。)


以上、確率や統計の世界に少しでも興味をもっていただけたらなぁ・・・と期待するharisenbonでした。

他の回答者の方々がおっしゃっているように、標準偏差はデータのばらつきを表すものです。
なんらかの計算をして確率を出しても、数値1個では標準偏差は出せません。
データが複数あって、平均や標準偏差が計算できます。

barはvarの誤りでしょうか。varは一般に分散を表現するキーワードですね。Excelを使っているのでしょうか?
varは(データ - データの平均値)の2乗の和をデータ数で割ったものなので、非常に大きく(データが小数点以下なら小さく)なります。

2乗のデータをそのまま足すことに...続きを読む

Q頻度で与えられたデータから標準偏差や分散は求められますか?

例えばある現象の影響を予測したとき、その影響が起こる頻度が下記のように求められたとします。

影響 頻度
1 , 0.1
5 , 0.4
10 , 0.1
15 , 0.13
17 , 0.1
20 , 0.07
22 , 0.07
25 , 0.03

頻度は全て合計すると1になります。このようなデータから影響の標準偏差や分散を求めることは可能なのでしょうか?

言い方を変えると、確率分布が分かっている現象があった場合に、それから標準偏差や分散が求められるのでしょうか?

もしダメな場合、このようなデータ群の特徴を表現するために有効な統計値は何があるでしょうか?

ご存じの方からすると非常に稚拙な質問かもしれませんが、自分ではどのように考えれば良いか分からず困っております。ぜひとも宜しくお願いいたします。

Aベストアンサー

一応確認ですが影響という数字は定量的なものですよね。それを前提に


P(X)に従う確率変数Xの期待値をE(X)で表し、分散をV(X)で表すと

E(X)=Σ{i*P(X)}
V(X)=E(X^2)-{E(X)}^2

そして標準偏差={V(X)}^0.5

です。

E(X)=1*0.1+5*0.4+・・・=10.44
E(X^2)=1^2*0.1+5^2*0.4+・・・・・=158.88
V(X)=158.88-10.44^2=49.8864
σ=7.06

といったところでしょうか。

Q標準偏差と平均偏差の違い

標準偏差と平均偏差は、数字としての意味は何が違うのでしょうか。(算出方法の違いなどは分かります)
換言すれば、平均偏差でもサンプルのばらつきが表現できるのに、わざわざ計算過程をややこしくして標準偏差を求めることにどのようなメリットがあるのかということです。

『数種類の検体を用いて同一行程の実験を行い、その結果の値の揺れ(ばらつき)を求めたい』

このレポートへのアプローチとして、平均偏差または標準偏差を利用するとき、両者が意味的にどのような違いをもつのか、ご教授ください。

Aベストアンサー

ばらつきの大きさを比較したいなら、どちらでも同じでしょう。

違いを考えるには、平均とは何か?ということが鍵になります。サンプルの平均は m=(x1+...+xn)÷n で求めるのが通例ですが、なぜこうするのがよいか?を考えてみてください。

実は、このようにして求める平均は、標準偏差の2乗和を最小にします。
では、平均偏差を最小にするような値を計算してみましょう。つまり、
  J= |x1-μ|+...+|xn-μ| を最小にするμを求めるわけです。
例えば、データが(1,1,1,0,-3)だったとします。
m=0 となりますが、(2)式を最小にする値は、0ではありませんね。
一方で,標準偏差の2乗和
 V= (x1-μ)^2+...+(xn-μ)^2
を最小にするμはVをμで微分して=0と置いて、とけば
 μ=m であることがわかります。
平均偏差を最小にする値は中央値ですので、そこが違うということになるわけです。

Q結局その数値 分散,標準偏差の数値は何?

こんにちは。
 計算は公式に入れてなんとかできました。次の問題です。
 問題 5人の生徒の英語のテストの得点xである。
      50, 70, 90, 80, 50 (点)
   (1) 偏差の2乗の平均値を求めることにより,分散s^2を求めよ。
   (2) 標準偏差を求めよ。

 (1) 平均値 点数総和 340なので,340/5=68(点)
    偏差の平方の和 1280なので,
s^2=1280/5=256

 (2) 標準偏差 s=√256=16(点)

 この256とか16点の数値の意味が教科書になく、16点だから何?という
ことです。
 分散は標準偏差をもとめる段階での数値と理解していいのでしょうか。

Aベストアンサー

散らばり具合を示す数値です。
10点満点のテストで、全員が6点をとったら、散らばりはないので 散らばり度0です。平均点は6点です。
わずかな散らばりが起こるのは ひとりだけ、5点か7点で、平均から1点離れたときです。散らばり度1です。
さらにわずかに散らばりが増すのは、一人が平均から1点分離れたときです。散らばり度2となります。
つまり、平均から一人ひとりが離れて行くほど、散らばり度は増していきます。
ですから、全員について、各人の平均との差を合計したものが全体の散らばり度になります。
これが散らばり度を考える基本です。
もう少し、高度な考え方が、単に平均との差ではなく、平均との差の2乗で調べようというものです。
2乗するので値は大きくなりますが、そのために基本と比べて逆転が起こる、というようなことはありません。
(平均との差の2乗)の総計 で求めるのが分散です。(実際は人数の影響を受けないよう、1人分にしますが)
そして、基本に近くなるよう、2乗をもとに戻すため、ルートをとるのが、標準偏差です。
分散、標準偏差の方が、基本よりも便利なことが多いです。

散らばり具合を示す数値です。
10点満点のテストで、全員が6点をとったら、散らばりはないので 散らばり度0です。平均点は6点です。
わずかな散らばりが起こるのは ひとりだけ、5点か7点で、平均から1点離れたときです。散らばり度1です。
さらにわずかに散らばりが増すのは、一人が平均から1点分離れたときです。散らばり度2となります。
つまり、平均から一人ひとりが離れて行くほど、散らばり度は増していきます。
ですから、全員について、各人の平均との差を合計したものが全体の散らばり度にな...続きを読む

Q標準平均Xバーの標準偏差について

たびたびすみません。
http://oshiete1.goo.ne.jp/qa3484149.html
を質問させていただいたものです。

まず、「標準平均Xバーの標準偏差」というのは「標本誤差」という
のですか?
そもそもこの標本誤差というのは何に役立つのでしょうか?

高校の数学の教科書の問題で、下記のようなものがありました。
「ある県の17歳男子の体重の平均値は62kg、標準偏差は9kgである。
 この県の17歳男子100人を無作為抽出で選ぶとき、100人の体重の
 平均Xバーの期待値と標準偏差を求めよ。」

この標準誤差?というのは9/√100で0.9kgとなると思うのですが、
この0.9kgはどんな意味をもつのでしょうか?

100人全体の標準偏差は、「標本標準偏差」というものになり本来は
分母をn-1にして、これが母標準偏差の推定値ということなんです
よね?それでこれはだいたい9kgに近いということですよね?
(分母をnにしたものを標本標準偏差と呼ぶの?)

文章下手ですみません。
よろしくお願いします。

たびたびすみません。
http://oshiete1.goo.ne.jp/qa3484149.html
を質問させていただいたものです。

まず、「標準平均Xバーの標準偏差」というのは「標本誤差」という
のですか?
そもそもこの標本誤差というのは何に役立つのでしょうか?

高校の数学の教科書の問題で、下記のようなものがありました。
「ある県の17歳男子の体重の平均値は62kg、標準偏差は9kgである。
 この県の17歳男子100人を無作為抽出で選ぶとき、100人の体重の
 平均Xバーの期待値と標準偏差を求めよ。」

この標準...続きを読む

Aベストアンサー

高校の教科書の問題が意図しているものが標準誤差なのかどうかは分かりませんが、標本平均値のばらつきの程度(つまり平均値の標準偏差)は標準誤差によって表されます。標準誤差が分かると、推定の精度がわかります。詳しくは参考書を読むか、googleすれば分かるでしょう。

> この標準誤差?というのは9/√100で0.9kgとなると思うのですが、

95%の信頼区間は標本平均±標準誤差*1.96で表されます。つまり、今回の場合だと

[62 - 0.9 * 1.96, 62 + 0.9 * 1.96] = [60.236, 63.764]

となりますから、母平均が60~63の区間に含まれる確率が95%ですよというわけです。

> 100人全体の標準偏差は、・・・

標準偏差はデータのばらつきの程度を表したものです。今回の場合だと、標準偏差が9なのですから、

[62 - 9 * 1.96, 62 + 9 * 1.96] = [44.36, 79.64]

という公式に基づいた計算をすると、標本値(データ)は44kg~79kgの範囲内に95%程度のデータが存在しているというわけです。

> 分母をnにしたものを標本標準偏差と呼ぶの?

違います。分母がnであろうと、n-1であろうとそれはまぎれもなく標本標準偏差(単に標準偏差と呼ぶ)です。分母がnであるのは普通の標準偏差で、分母がn-1であるのは不偏推定量です。不偏推定量の標準偏差だとサンプルサイズが小さくても誤差が少ないというわけ。

高校の教科書の問題が意図しているものが標準誤差なのかどうかは分かりませんが、標本平均値のばらつきの程度(つまり平均値の標準偏差)は標準誤差によって表されます。標準誤差が分かると、推定の精度がわかります。詳しくは参考書を読むか、googleすれば分かるでしょう。

> この標準誤差?というのは9/√100で0.9kgとなると思うのですが、

95%の信頼区間は標本平均±標準誤差*1.96で表されます。つまり、今回の場合だと

[62 - 0.9 * 1.96, 62 + 0.9 * 1.96] = [60.236, 63.764]

となりますから、...続きを読む

Qクラスの人数と平均点のみから標準偏差や偏差値を求めることはできるか

お願いします。

複数のクラスでテストを実施しました。
各クラスの人数と、クラスの平均点はわかります。個々の点数はわかりません。
この場合、標準偏差を求めることはできるでしょうか。
可能な場合、どのようにして求めるのでしょうか。
(テストを受けた人たちは、以下のクラスで全員となります)

Aクラス:15人、平均76点
Bクラス:20人、平均72点
Cクラス:25人、平均78点
Dクラス:30人、平均67点
Eクラス:10人、平均70点

全員の平均は72.4になります

エクセルで上記の数値をSTDEVPすると約3.97となります。
しかし、各クラスの人数が異なるのにこの計算式でやってしまって良いのか気になります。たぶんダメですよね。

しかし個々の点数がわからないのですから、仮にAクラスには76点の人が15人(全員が76点)として、Bクラスには72点の人が20人にて・・・ということにして計算を勧めた方が、より正しい標準偏差が出せるでしょうか?

Aクラスは15人全員が、平均点に対して3.4ポイント高く、その総和(15人分)を2乗して2061という数字を出し・・・これを各クラスで集計して合計した17,820という値を、データ数(生徒全員)である100でわると、約13.34という標準偏差らしきものが出るのですが。。。

個々の点数がわからない場合、もっとも精度の高い標準偏差(らしきもの)を出すにはどうすればよいでしょうか?

お願いします。

複数のクラスでテストを実施しました。
各クラスの人数と、クラスの平均点はわかります。個々の点数はわかりません。
この場合、標準偏差を求めることはできるでしょうか。
可能な場合、どのようにして求めるのでしょうか。
(テストを受けた人たちは、以下のクラスで全員となります)

Aクラス:15人、平均76点
Bクラス:20人、平均72点
Cクラス:25人、平均78点
Dクラス:30人、平均67点
Eクラス:10人、平均70点

全員の平均は72.4になります

エクセルで上記の数値をSTDEVPする...続きを読む

Aベストアンサー

No.2です。No.2には「標準偏差の目安」と書きましたが、正確に言えば「目安にもならない」ものです。

「クラス全員がそのクラスの平均点を得点した」という仮定での「ヒストグラム」を書いてみれば分かります。
全員が「67~78点」の範囲内にプロットされるわけですから。そんな分布の「標準偏差」には意味がありません。

従って、現実的には「これで標準偏差もどきを求めても無駄である」ということを付記しておきます。

クラスの人数を加味した「学年全体の平均値」は正しい値なので、使えます。

Q平均と標準偏差から分布を復元

表題のとおりです。

例えば学校の試験で平均点と標準偏差だけを知ることができた場合、
その情報からおおよその分布の様子を取り出すことは可能でしょうか?

具体的には、ある学校の生徒から
「平均点18点の試験で48点を取った。偏差値55だったっさ~」と聞きまして、
平均48で偏差値55なら、標準偏差60??
100点満点の試験で平均が18点、標準偏差が60、せいぜい人数は100~150人。
、、、ってどんな分布よ??
ということが発端なのですが、
この例に関しては平均点の情報か偏差値の情報が間違っていると思うんですが、どうでしょうか?

Aベストアンサー

試験が100点満点でかつ0点以上ならばそのようなことは絶対に起こりえないと思います。標準偏差が60である以上、だいたいの得点域が18-60~18+60ということになるはずですからね。平均18で最も分散(したがって標準偏差)が大きくなるような例は、0点と100点にしか得点分布がない場合です。それ以外ならこれより分散は小さくなります。妥当な例ではないですが、

0点…100人
48点…1人
100点…20人

の合計121人だと仮定すると、平均16.9、標準偏差37.25ぐらいになりました。これぐらいが限界っぽいですね。


平均点と標準偏差から得られる情報はまさに平均と標準偏差のみなので、それ以上の有益な情報は得られません。たとえば分布が正規分布とか具体的に形が分かっている場合は別ですが。上記のような極端な例、つまりある具体的なサンプルの全体に占める位置と平均、標準偏差が分かっている場合には、上の例では間違いなく正規分布ではない、というようなことは分かります。パラメトリック(分布の形をパラメータ依存の形で具体的に指定して)な方法で適合度検定を行い、おおよその分布を推定→検定する方法はあるにはありますが、それにはやはりいくつかのサンプルが必要です。ですが、このような学校の試験のような場合は普通、平均、標準偏差を出す過程で全サンプルの様子が分かっているはずなので、ちょっと問題にしにくいですね。

試験が100点満点でかつ0点以上ならばそのようなことは絶対に起こりえないと思います。標準偏差が60である以上、だいたいの得点域が18-60~18+60ということになるはずですからね。平均18で最も分散(したがって標準偏差)が大きくなるような例は、0点と100点にしか得点分布がない場合です。それ以外ならこれより分散は小さくなります。妥当な例ではないですが、

0点…100人
48点…1人
100点…20人

の合計121人だと仮定すると、平均16.9、標準偏差37.25ぐらいになりました。これぐらいが限界っぽいですね。

...続きを読む

Q平均値、標準偏差、幾何平均、幾何標準偏差の推定

数学素人でさっぱり意味が分かりません。
分布なのですが、一部書き込みます。
A  累積分布  確率密度
1   0.0009329 0.0009329
2  0.0012776 0.0003447
4  0.0023306 0.0010530
6  0.0040988 0.0017682
8  0.0069518 0.0028531
10  0.0113821 0.0044303
~   ~     ~
28  0.4085144 0.0898605
30  0.5000000 0.0914856
32  0.5882070 0.0882027
~   ~     ~
68  0.9995101 0.0002532
70  0.9996741 0.0001640
80  0.9999535 0.0002795
100 0.9999989 000000453

Aを正規分布で近似した場合、平均値と標準偏差の推定
Aを対数正規分布で近似した場合、幾何平均と幾何標準偏差の推定
エクセルにデータ入れて計算しようとしてるのですが、方法が分かりません。どのように計算すれば良いのでしょうか?全く知識ないのですみませんが御教授してください。(何か計算に足りない物があれば指摘下さい)

数学素人でさっぱり意味が分かりません。
分布なのですが、一部書き込みます。
A  累積分布  確率密度
1   0.0009329 0.0009329
2  0.0012776 0.0003447
4  0.0023306 0.0010530
6  0.0040988 0.0017682
8  0.0069518 0.0028531
10  0.0113821 0.0044303
~   ~     ~
28  0.4085144 0.0898605
30  0.5000000 0.0914856
32  0.5882070 0.0882027
~   ~     ~
68  0.9995101 0.0002532
70  0.9996741 0.0001640
80  0.9999535 ...続きを読む

Aベストアンサー

【解ければ何でもいいよ、という場合】

以下のページを参考に。ほとんど何も考えずにフィット完了。
http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/solver.html

対数正規分布にする場合は
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/log-normal.html
幾何平均と幾何分散は真ん中あたりにちょろっと書いてある。分散→標準偏差に直すこと。
Aはすでに対数であると仮定して話を進めれば、フィッティングは普通の正規分布で出した結果を使い、それを対数正規分布だったと読み替えるだけ。

統計学自習ノート@群馬大青木研はネットで統計やるとき最も支持されている教科書だからブックマークしておくとよい。



【考えて解きたい場合】

正規分布の定義は以下の式
http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

フィッティングはとりあえず最小二乗法
http://ja.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%97%E6%B3%95

Σ[i=0→n](yi-f(xi))^2
の最小値問題に帰着できる、と。

私はこの方法やったことないけど。もっと強引な近似でやってるが、統計の授業では教えてはいけない気がするので却下。

http://szksrv.isc.chubu.ac.jp/lms/lms1.html
も参照(ただし直線近似なので参考にしかならず)

【解ければ何でもいいよ、という場合】

以下のページを参考に。ほとんど何も考えずにフィット完了。
http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/solver.html

対数正規分布にする場合は
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/log-normal.html
幾何平均と幾何分散は真ん中あたりにちょろっと書いてある。分散→標準偏差に直すこと。
Aはすでに対数であると仮定して話を進めれば、フィッティングは普通の正規分布で出した結果を使い、それを対数正規分布だったと読み替えるだけ。

統計学自...続きを読む


人気Q&Aランキング

おすすめ情報