A 回答 (1件)

00/12/07のrickbonさんの質問でこの解答はありますよ。


教育>理系の質問>数学>基本的な質問ですが
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aと関連する良く見られている質問

Q相関係数と標準偏差

相関係数と標準偏差
相関係数の分母がなぜ標準偏差になるのかわかりません。
なぜ平均や分散ではだめなのでしょうか。
数学の初心者にもわかりやすい解説をいただけるとうれしいです。

Aベストアンサー

> 相関係数の分母がなぜ標準偏差になるのか

相関係数を無次元化(参考 URL)するためです。

たとえば x が時間を年で測ったもの、y が長さを m で測ったものとします。x と y の相関係数の、分子の単位は 年・m になります。x の標準偏差の単位は年、y の標準偏差の単位は m ですから、分母の単位も 年・m になります。分母と分子の単位が同じなので、x と y の相関係数の単位はなくなります。

> なぜ平均や分散ではだめなのでしょうか。

分母を x の平均と y の平均の積にすると、分子と分母の比は何を表現しているのか、解釈が難しいです。分母を x と y の分散の積にしても同様で、その上、単位を気にしないといけなくなるので、使いものになりません。

参考URL:http://ja.wikipedia.org/wiki/%E7%84%A1%E6%AC%A1%E5%85%83%E6%95%B0

Q平均値、標準偏差、幾何平均、幾何標準偏差の推定

数学素人でさっぱり意味が分かりません。
分布なのですが、一部書き込みます。
A  累積分布  確率密度
1   0.0009329 0.0009329
2  0.0012776 0.0003447
4  0.0023306 0.0010530
6  0.0040988 0.0017682
8  0.0069518 0.0028531
10  0.0113821 0.0044303
~   ~     ~
28  0.4085144 0.0898605
30  0.5000000 0.0914856
32  0.5882070 0.0882027
~   ~     ~
68  0.9995101 0.0002532
70  0.9996741 0.0001640
80  0.9999535 0.0002795
100 0.9999989 000000453

Aを正規分布で近似した場合、平均値と標準偏差の推定
Aを対数正規分布で近似した場合、幾何平均と幾何標準偏差の推定
エクセルにデータ入れて計算しようとしてるのですが、方法が分かりません。どのように計算すれば良いのでしょうか?全く知識ないのですみませんが御教授してください。(何か計算に足りない物があれば指摘下さい)

数学素人でさっぱり意味が分かりません。
分布なのですが、一部書き込みます。
A  累積分布  確率密度
1   0.0009329 0.0009329
2  0.0012776 0.0003447
4  0.0023306 0.0010530
6  0.0040988 0.0017682
8  0.0069518 0.0028531
10  0.0113821 0.0044303
~   ~     ~
28  0.4085144 0.0898605
30  0.5000000 0.0914856
32  0.5882070 0.0882027
~   ~     ~
68  0.9995101 0.0002532
70  0.9996741 0.0001640
80  0.9999535 ...続きを読む

Aベストアンサー

【解ければ何でもいいよ、という場合】

以下のページを参考に。ほとんど何も考えずにフィット完了。
http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/solver.html

対数正規分布にする場合は
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/log-normal.html
幾何平均と幾何分散は真ん中あたりにちょろっと書いてある。分散→標準偏差に直すこと。
Aはすでに対数であると仮定して話を進めれば、フィッティングは普通の正規分布で出した結果を使い、それを対数正規分布だったと読み替えるだけ。

統計学自習ノート@群馬大青木研はネットで統計やるとき最も支持されている教科書だからブックマークしておくとよい。



【考えて解きたい場合】

正規分布の定義は以下の式
http://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

フィッティングはとりあえず最小二乗法
http://ja.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%97%E6%B3%95

Σ[i=0→n](yi-f(xi))^2
の最小値問題に帰着できる、と。

私はこの方法やったことないけど。もっと強引な近似でやってるが、統計の授業では教えてはいけない気がするので却下。

http://szksrv.isc.chubu.ac.jp/lms/lms1.html
も参照(ただし直線近似なので参考にしかならず)

【解ければ何でもいいよ、という場合】

以下のページを参考に。ほとんど何も考えずにフィット完了。
http://aoki2.si.gunma-u.ac.jp/Hanasi/StatTalk/solver.html

対数正規分布にする場合は
http://aoki2.si.gunma-u.ac.jp/lecture/Bunpu/log-normal.html
幾何平均と幾何分散は真ん中あたりにちょろっと書いてある。分散→標準偏差に直すこと。
Aはすでに対数であると仮定して話を進めれば、フィッティングは普通の正規分布で出した結果を使い、それを対数正規分布だったと読み替えるだけ。

統計学自...続きを読む

Qこの問題の分散と標準偏差のやり方がわかりません(泣)誰かわかりやすくやり方教えてください〜

この問題の分散と標準偏差のやり方がわかりません(泣)誰かわかりやすくやり方教えてください〜

Aベストアンサー

No.2です。

(3)は、yi = (3xi - 5)/2 を各々計算して、同じことを繰り返せば求まります。やってみるとよい。

ただ、平均値や標準偏差の意味が分かっていれば、
 ・平均値は ybar = (3xbar - 5)/2
 ・標準偏差は (3/2)s(x)
になることが分かるはず。

上のやり方と比べてみるよい。

Qどうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+5

どうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+50 を導き出したのでしょう? また、どうしてこの公式なのでしょう?
知っている方、教えてください

Aベストアンサー

 入試の合否判定は相対評価でなされるので、入試に合格する目安は、受験者集団の中で本人がどの辺にいるか、ということになります。例えば、模擬試験の平均点が70点だったとして、それだけでは何もわかりません。平均点が60点のときの70点ならば集団の中のやや上位と言えるし、平均点が70点ならばその人は集団の真ん中にいる、といえるわけです。

 次に、平均点が60点ので本人得点が70点だったとき、集団のどの辺にいるか、ということは、他の受験者の点数の散らばり具合にもよります。平均60点で、ほとんどの受験生が55点~65点、という場合なら、70点はかなり上位になります。また、平均60点でも、30点台も90点台もごろごろいるような場合なら、70点といってもそんなに上位になならないでしょう。

 そこで、「標準偏差」という、テストの点の散らばり具合を表す数を使います。
 平均60点で、標準偏差が10点なら、50点~70点の範囲に、受験生の68%がいることになるので、70点の人は上位16%のところにいることがわかります。つまり、平均点から標準偏差だけ離れておれば、上位16%のところにいる、ということです。
 もし標準偏差が5点なら55点~65点の範囲に受験生の68%がおり、50点~70点の範囲には95%の受験生がいることになりますので、このときの70点なら上位3%のところにいることがわかります。つまり、平均点から標準偏差の2倍だけ離れておれば、上位3%のところにいる、ということです。

 このように、平均点からのずれが標準偏差の何倍かがわかれば、本人の集団での位置がわかり、「あなたの得点は,標準偏差の○○倍だけ離れています」ということで、受検などに対する目安がわかります。

 ほんとはこれだけでいいのですが、「平均点からのずれが標準偏差の0.6倍」とかいってもわかりにくいと思ったある中学校の先生が、今使われている「偏差値」という表し方を考えました。
 まず、(得点ー平均点)÷標準偏差 だと小数になるところを10倍しました。(「0.6倍」よりは「6点」のほうがわかりやすい?)
 それから、平均より低い場合にマイナス(平均点より低いと -6点 とか)になるので、マイナスにならないように、全体に50を足した、というものです。

 偏差値が50→平均そのもの→集団の真ん中
 偏差値が60→平均点から標準偏差の分だけ高い→集団の上位16%

などということになります。


>どうやって偏差値の公式、 偏差値=(得点ー平均点)÷標準偏差×10+50 を導き出したのでしょう? >また、どうしてこの公式なのでしょう?

については、上述したように必然的な結果というわけではなく、「適当に」決めたものです。

http://www.stockage2002.com/archives/category/%E5%81%8F%E5%B7%AE%E5%80%A4%E3%81%A3%E3%81%A6%EF%BC%9F

 入試の合否判定は相対評価でなされるので、入試に合格する目安は、受験者集団の中で本人がどの辺にいるか、ということになります。例えば、模擬試験の平均点が70点だったとして、それだけでは何もわかりません。平均点が60点のときの70点ならば集団の中のやや上位と言えるし、平均点が70点ならばその人は集団の真ん中にいる、といえるわけです。

 次に、平均点が60点ので本人得点が70点だったとき、集団のどの辺にいるか、ということは、他の受験者の点数の散らばり具合にもよります。平均60点...続きを読む

QMATLABでの標準偏差

MATLABでの標準偏差

MATLABで入力するいくつかの数値の標準偏差が分かっているのですが、
その変数たちで作られる関数の標準偏差を求めることは出来ますか?
例えば、x、yに標準偏差を導入した場合、
f(x、y)の標準偏差をもとめたいのですが。
たとえば、f(x、y)=xyだった場合、
まず、どのように、x、yの標準偏差を導入し、
どのようにfの標準偏差を求めればよいでしょうか?
コマンド文を教えてください。

Aベストアンサー

う~ん、これは……。
いや、MATLABの問題じゃないような……。

読んだ感じですと、「使おうとしている統計」自体が凄く曖昧な気がしています。
例えば、

>いくつかの数値の標準偏差が分かっている

と言う事はxの標準偏差とyの標準偏差が分かっている?
と言うことはxもyも確率変数でそれぞれ別の分布に従っている、と。
だったら、ダイレクトに任意の分布をp_iとして

f_1(x)=p_1(x)
f_2(y)=p_2(y)

ですね。

>f(x、y)の標準偏差をもとめたいのですが。
>たとえば、f(x、y)=xyだった場合、
>まず、どのように、x、yの標準偏差を導入し、
>どのようにfの標準偏差を求めればよいでしょうか?

ここら辺から凄く怪しい事言ってます(笑)。
例えばf(x,y)とは言っても、

・確率変数xとyが独立な場合
・確率変数xとyが関係している場合

で全然変わってきますね。
仮に独立だったら話は簡単で、

f(x,y)=p_1(x)×p_2(y)

で終了です。これなら別に考え込む事が無いんですが……。
問題は2番目のケースですね。ちょっとどっちの想定を行ってるのかが分かりません。xの振る舞いにyが左右されている、とかないしは逆の場合ですと、同時分布にしないとダメでしょう。まあ、難しい方法じゃなくても、xとyが同時にどう言う分布に従うのか調べないといけないでしょうね。

う~ん、これは……。
いや、MATLABの問題じゃないような……。

読んだ感じですと、「使おうとしている統計」自体が凄く曖昧な気がしています。
例えば、

>いくつかの数値の標準偏差が分かっている

と言う事はxの標準偏差とyの標準偏差が分かっている?
と言うことはxもyも確率変数でそれぞれ別の分布に従っている、と。
だったら、ダイレクトに任意の分布をp_iとして

f_1(x)=p_1(x)
f_2(y)=p_2(y)

ですね。

>f(x、y)の標準偏差をもとめたいのですが。
>たとえば、f(x、y)=xyだ...続きを読む

Qサンプルの平均値と上限値と下限値から標準偏差を推定することはできますか。

サンプルの平均値と上限値と下限値から標準偏差を予測することはできますか。
平均値と標準偏差を用いて統合解析を行いたいのですが、標準偏差の代わりに上限値と下限値が記された文献情報の取り扱いに苦慮しております。
確度は低くても一般的にこんなのがあるよ、というような情報をご教授下さい。

Aベストアンサー

厳密には無理ですが,ある程度推定することはできます。

サンプルの個数が非常に多い場合で,上限値下限値がわかっている場合には上限値,下限値を3シグマと見てよいと思われます。
この場合には平均値は上限値と下限値の中央に来ているはずです。

これは平均±3シグマに99.7%が入るのでほとんどすべてと見てよいからです。
http://www.sci.kagoshima-u.ac.jp/~itls/Japanese/chapter4/keyword/sigma.html

平均が上限値,下限値の中央に無い場合にはサンプル数が少ないことを意味しており,上限値,下限値を3シグマと考えてはまずく,シグマとか2シグマと見なす必要がある(つまり標準偏差は大きい)と思います。

Q標準偏差って?

標準偏差ってもんがどんなものなのかわかりません。

あるクラスの、
国語のテストの平均が60点、標準偏差が5。
算数のテストの平均が80点、標準偏差が8。

とすると合計得点の平均点は140点だと思うのですが、標準偏差はどうなりますか?
それともこれだけじゃわかりませんか?

Aベストアンサー

統計学には「正規分布の再生性」という定理があって、

「二つの確率変数X、Yが互いに独立で、正規分布し、
Xの平均がa、標準偏差がα、
Yの平均がb、標準偏差がβ とすると、
X+Yの平均はa+b、標準偏差は√(α^2 + β^2)
(^2は2乗の意味)
となる」
とあります。
これを問題に当てはめてみると、
標準偏差は√(5^2 + 8^2)で√89となります。

ただし問題は定理の中の「互いに独立」というところです。
国語・数学のテストは、独立になってません。
すなわち、国語の成績のいい子は、数学も成績がいい場合が多いだろうと考えられます。
XとYがまったく関係がないなら計算できますが、
テストの場合は上の定理が成り立ちません。
(標準偏差の値は上の値より増えると考えられます)

Qクラスの人数と平均点のみから標準偏差や偏差値を求めることはできるか

お願いします。

複数のクラスでテストを実施しました。
各クラスの人数と、クラスの平均点はわかります。個々の点数はわかりません。
この場合、標準偏差を求めることはできるでしょうか。
可能な場合、どのようにして求めるのでしょうか。
(テストを受けた人たちは、以下のクラスで全員となります)

Aクラス:15人、平均76点
Bクラス:20人、平均72点
Cクラス:25人、平均78点
Dクラス:30人、平均67点
Eクラス:10人、平均70点

全員の平均は72.4になります

エクセルで上記の数値をSTDEVPすると約3.97となります。
しかし、各クラスの人数が異なるのにこの計算式でやってしまって良いのか気になります。たぶんダメですよね。

しかし個々の点数がわからないのですから、仮にAクラスには76点の人が15人(全員が76点)として、Bクラスには72点の人が20人にて・・・ということにして計算を勧めた方が、より正しい標準偏差が出せるでしょうか?

Aクラスは15人全員が、平均点に対して3.4ポイント高く、その総和(15人分)を2乗して2061という数字を出し・・・これを各クラスで集計して合計した17,820という値を、データ数(生徒全員)である100でわると、約13.34という標準偏差らしきものが出るのですが。。。

個々の点数がわからない場合、もっとも精度の高い標準偏差(らしきもの)を出すにはどうすればよいでしょうか?

お願いします。

複数のクラスでテストを実施しました。
各クラスの人数と、クラスの平均点はわかります。個々の点数はわかりません。
この場合、標準偏差を求めることはできるでしょうか。
可能な場合、どのようにして求めるのでしょうか。
(テストを受けた人たちは、以下のクラスで全員となります)

Aクラス:15人、平均76点
Bクラス:20人、平均72点
Cクラス:25人、平均78点
Dクラス:30人、平均67点
Eクラス:10人、平均70点

全員の平均は72.4になります

エクセルで上記の数値をSTDEVPする...続きを読む

Aベストアンサー

No.2です。No.2には「標準偏差の目安」と書きましたが、正確に言えば「目安にもならない」ものです。

「クラス全員がそのクラスの平均点を得点した」という仮定での「ヒストグラム」を書いてみれば分かります。
全員が「67~78点」の範囲内にプロットされるわけですから。そんな分布の「標準偏差」には意味がありません。

従って、現実的には「これで標準偏差もどきを求めても無駄である」ということを付記しておきます。

クラスの人数を加味した「学年全体の平均値」は正しい値なので、使えます。

Q母標準偏差・標本標準偏差と標本平均(Xバー)の標準偏差

(聞きたいのは、最後の3行がメインです)
http://oshiete1.goo.ne.jp/qa3478996.html
の質問をしたものです。

標準偏差を求めるとき、(ルートの中の)分母が「n」か「n-1」
の2種類があることはわかりました。
母標準偏差であっても標本標準偏差であっても「n」で求められる
が、標本から母標準偏差を推定するときが「n-1」を使うという
ことで理解しました。

ところで、「n」にしても「n-1」にしてもそんなに値としては
変わらないということなんですよね?

高校の時の教科書で、「標本平均(Xバー)の標準偏差」という
のがありました。
 「母平均m、母標準偏差sの母集団から大きさnの無作為標本
 抽出するとき、標本平均Xバーの標準偏差σ=s/(ルートn)」
というのがありました。
 「標本標準偏差」とこの「標本平均Xバーの標準偏差」というの
は全然違うものなんですよね?(値も全然違うものになってしま
うと思います。)

Aベストアンサー

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、その標準偏差、すなわち標本標準偏差(不偏標準偏差ともいう)を代わりに用いることになります。標本は、ランダムサンプリングをするので、選ぶたびに異なり、そのバラツキは母集団とは同一の標本にはなりません
 そこで、母標準偏差はnで割るので、標本標準偏差はn-1で割っておけばやや広い範囲になるので、標本の選択が少々不味くても、広めに取ってあるのでカバーできることになります(数学的には証明できるようですが、私には無理なので、直感的に表現しました)。もちろん、標本数が大きければ、nであろうが、n-1であろうが大差はありません。このようにして、計算が非現実的な母集団のバラツキを推定するわけです。標本標準偏差は、母標準偏差の代理なのです。

>標本平均Xバーの標準偏差
 標準偏差は、母集団のバラツキを示します。標本標準偏差は、母集団のバラツキの推定値です。
 これは、標準誤差で、母集団から抽出した「標本の平均値のバラツキ」を示しています。平均ですから、再度nで割り算することになります。外国人の論文には、バラツキがグラフ上などでは小さく見えるので、標本標準偏差(母集団のバラツキの推定値)ではなく、この標準誤差(標本の平均値のバラツキ)で示したものを見かけます。

 なお、標準偏差は、英語ではStandard Deviation、エクセルではSTDEVPでPの根拠が不明。標準誤差は、英語ではPartial Standard Deviation、エクセルはSTDEVで、Patialの単語の部分が見当たりません。エクセルの関数を使うときは、逆にやりそうで、いつも混乱しています。

 統計学での目的は、集団全体のこと、すなわち母集団について知ることです。

 標準偏差は、集団のばらつきの程度を示し、本当に知りたいのは母集団の標準偏差、すなわち、母標準偏差です。しかし、母標準偏差が現実には求められない場合があります。一つは標本数が多すぎる場合、もう一つは蛍光灯の寿命のように全てを調べると商品が残らなくなつてしまう場合です。
 そこで、仕方なくその一部を取り出す(=抽出して)、母集団のバラツキを推定します。母集団を推定するためには、いくつかを標本として選び、...続きを読む

Q標準偏差がわからない平均値だけでの検定

私は下垂体という組織に刺激を与えた場合と与えなかった場合で、
ある物質の量に変化が起きるかどうかの研究をしているのですが、
下垂体はとても小さくて5個以上を一緒にしないと物質を抽出して
定量することが出来ません。

刺激群と非刺激群との間に有意差があるかをどうかを知りたいのですが、
どのような検定をすればいいのか教えてください

ちなみに物質の量は細胞に常に同じ量で存在する他の物質との比で
考えますので絶対量は必要ありません。

Aベストアンサー

もし5個を纏めて一回分析したサンプルが刺激群と非刺激群に一つずつしかないのでしたら、有意差の検定はできないと思います。それぞれの群について複数のデータがあるのでしたら、以下の処方で可能と思います。
それぞれの群の分析値の母分散に有意差があるかどうかはF検定でできます。即ち、分析値がそれぞれn1個、n2個あったとして、不偏分散をU1^2, U2^2とすると、F=U1^2/U2^2はF分布に従います。多分バラツキの程度に差が出ないと思いますから一睨みで分散に有意差がないことはわかるのではないでしょうか。
そして二つの群の分散σ1=σ2=σと共通におけるとき、この共通のσはそれぞれの不偏分散U1^2, U2^2から次の式で推定されます。
U^2={(n1-1)U1^2+(n2-1)U2^2}/(n1+n2-2)...(1)
この時
T={(X1-X2)-(μ1-μ2)}/U√α...(2)
(α=1/n1 +1/n2)
が自由度n1+n2-2のt分布をします。X1、X2は其々の群の分析値の平均、μ1、μ2は其々の群の母集合の平均値です。仮説としてはμ1=μ2ですから、問題とする式は
T=(X1-X2)/U√α...(3)
となります。このTを計算してt検定をすればよろしいと思います。Tの絶対値がゼロから著しく離れていれば、もとの仮説が棄却されて平均値に有意差があるということになります。たとえばそれぞれ5サンプルずつの分析値を出して平均をとったとすると、自由度5+5-2=8のt分布になります。どちらが大きいかわからないとすると両側検定になり、両側のどちらかにいる確率が5%の領域にいるのは2.306ですからTの絶対値がこれより大きければ有意差があると主張できます。ここでの危険率は5%です。

もし5個を纏めて一回分析したサンプルが刺激群と非刺激群に一つずつしかないのでしたら、有意差の検定はできないと思います。それぞれの群について複数のデータがあるのでしたら、以下の処方で可能と思います。
それぞれの群の分析値の母分散に有意差があるかどうかはF検定でできます。即ち、分析値がそれぞれn1個、n2個あったとして、不偏分散をU1^2, U2^2とすると、F=U1^2/U2^2はF分布に従います。多分バラツキの程度に差が出ないと思いますから一睨みで分散に有意差がないことはわかるのではないでしょうか。
...続きを読む


人気Q&Aランキング