今だけ人気マンガ100円レンタル特集♪

塾の講師をしています。生徒の学校定期テストの偏差値を計算したいのですが、度数分布表から簡単に標準偏差を求める方法はありませんか?あればエクセル初心者ですのでていねいに教えていただきたいのですが。

このQ&Aに関連する最新のQ&A

A 回答 (4件)

念のため補足です



A列に階層値xi
B列に度数fi

があるとすると、

C列に =Ai*Bi
D列に =Ai*Ai*Bi

を入力しC列の和(=sum(c1:cN))とD列の和(=sum(d1:dN))をもとめ、
それをNで割れば平均と二乗平均が出ます。

あとは、二乗平均-平均^2で分散を計算して、その平方根を取ります。

あらかじめ相対度数fi/Nを計算しておいたほうが便利かもしれません。

母集団分布の値が必要なら分散にN/(N-1)を書けた上で平方根を取る必要がありますが、
この場合だと、たぶん標本分布でかまわないと思いますね。
    • good
    • 3
この回答へのお礼

早速どうもありがとうございました。参考にさせていただきます。

お礼日時:2008/11/16 15:58

階層値をxi, 度数をfi, 標本数をN(=Σfi)として



平均=Σ(xi*fi)/N
二乗平均=Σ(xi*xi*fi)/N
分散=二乗平均ー平均の二乗=Σ(xi*xi*fi)/Nー[Σ(xi*fi)/N]^2
標準偏差=分散の平方根

で求めることができます。

分散は

分散=Σ[(xi-平均)^2*fi]/N

でも求められます(というかこちらが定義)が、最初のほうが簡単でしょう。
    • good
    • 1

No.1 です。


関数電卓で計算されているということであれば、あくまで概算でしかないことも、計算の考え方も十分理解されているということですね。おそらく、元々度数分布表から標準偏差を出すというやり方は想定されていないので、エクセルで特別簡単な方法というのはないと思います。

電卓でどのようにやられていたかわかりませんが、度数分布表のそれぞれの得点幅の中心値を、度数の数だけコピーして、個々のデータとして計算することになると思います。
    • good
    • 0
この回答へのお礼

早速どうもありがとうございました。関数電卓(CASIO FX-39)では標準偏差を求める機能がありまして例えば95×5M+85×12M+・・・という風に打ち込むと平均や標準偏差が求められるのですが・・・。そうですか。結構不便ですね。

お礼日時:2008/11/16 15:53

度数分布表からは、正しい平均値も標準偏差も出ないと思います。

なぜ度数分布表から求めたいのでしょうか?

偏差値を計算するということは、個々のデータはあるわけですよね? そうであれば、標準偏差は、STDEV という関数を使って、データ全体を選択すれば計算できます。

例えば、A1から A100 の範囲で個々のデータが入っている場合は、標準偏差の結果を入れないセルに、以下のように入力して下さい。

=stdev(A1:A100)

この回答への補足

塾にはいろんな中学校から生徒が来ます。学校の定期テストや実力テストの素点だけでは各生徒の成績が上がったのか、中学校内でどのくらいの位置にいるのか、といったことが容易に分かりません。それで、各学校のテストの度数分布表を手に入れてそこから平均値や標準偏差を関数電卓で求めていたのですが、ミスも多く時間もかかります。それでエクセルで簡単な方法がないかネットで調べたのですがなかなか見つかりません。もちろん、度数分布表から平均や標準偏差を求めると、誤差はあるでしょうが、それしか方法はないのです。塾内のテストではもちろん個々のデータから標準偏差を求めています。よろしくお願いします。

補足日時:2008/11/16 12:45
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QExcel2003で度数分布表をもとに平均値および標準偏差値を一発で出す関数はありますか?

あるシステムから大量の度数分布表を取得しています。
つまり元データは手元に存在しません。
度数分布表だけをもとに、平均値、標準偏差値を一発でだせる関数はありますか?

式を入力すれば可能なことは理解しているので、式の入力に関しての質問ではありません。

Aベストアンサー

一発で出す関数は存じません。
定義に従って(一体何年ぶりだろうか...)配列数式で計算すると、
平均:{=SUM(心点*度数)/SUM(度数)}
標準偏差:{=SQRT(SUM(度数*(心点)^2)/SUM(度数)-(SUM(心点*度数)/SUM(度数))^2)}
でどうでしょうか。
心点(階級の中心)の範囲に、「心点」、度数の範囲に「度数」という名前を付けておいて下さい。
念のために注釈しますと、式を入力後、Ctrl+Shift+Enterで確定すると、配列数式となり、{}が自動的に付きます。

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Qヒストグラムの平均と分散について

以下の問題の求め方がよく分かりません。どなたか助けてください・・・

(問)ある画像の平均値、分散を求めなさい。必ず具体的な式・求め方等も書き添えること。
 ヒストグラムは、1の頻度が2、 2の頻度が5、3の頻度が5、4の頻度が7、5の頻度が1

(答)平均値:3、分散:1.2 はどういう計算で求められるのだろうか?

よろしくお願いします。

Aベストアンサー

1の頻度が2というのは、1が2回という意味です。
2の頻度が5というのは、2が5回という意味です。

従い、問題のデータは、
1,1
2,2,2,2,2
3,3,3,3,3,
4,4,4,4,4,4,4

の全部で20個ですね。全部足すと60になりますね。


平均値は、全部を足した合計を個数で割れば良いです。
(1*2+2*5+3*5+4*7+5*1)/(2+5+5+7+1)
=60/20
=3


分散は、(各データから平均値を引いたもの)を2乗して、全て足したものを個数でわれば良いです。

((1-3)^2*2+(2-3)^2*5+(3-3)^2*5+(4-3)^2*7+(5-3)^2*1)/(2+5+5+7+1)
=24/20
=1.2

Q加重平均と平均の違い

加重平均と平均の違いってなんですか?
値が同じになることが多いような気がするんですけど・・・
わかりやす~い例で教えてください。

Aベストアンサー

例えば,テストをやって,A組の平均点80点,B組70点,C組60点だったとします.
全体の平均は70点!・・・これが単純な平均ですね.
クラスごとの人数が全く同じなら問題ないし,
わずかに違う程度なら誤差も少ないです.

ところが,A組100人,B組50人,C組10人だったら?
これで「平均70点」と言われたら,A組の生徒は文句を言いますよね.
そこで,クラスごとに重みをつけ,
(80×100+70×50+60×10)÷(100+50+10)=75.6
とやって求めるのが「加重平均」です.

Q±4σに入る確率について教えてください

ウィキペディアの検索より、
確率変数XがN( μ, σ2)に従う時、平均 μ からのずれがσ以下の範囲にXが含まれる確率は68.26%、2σ以下だと95.44%、さらに3σだと99.74%となる。
と分かりました。

そこで
4σ、


の場合確率はどうなるか教えてください。
よろしくお願い致します。

Aベストアンサー

Excel で NORMDIST を使い、平均 50、標準偏差 10 (いわゆる偏差値)で計算してみましたら、次のようになりました。

 σ 0.682689492137086
2σ 0.954499736103641
3σ 0.997300203936740
4σ 0.999936657516326
5σ 0.999999426696856
6σ 0.999999998026825
7σ 0.999999999997440
8σ 0.999999999999999
9σ 1.000000000000000

Excelの関数の精度がどの程度のものか分かりませんが、9σで100%になりました。

Qエクセル 0や空白のセルをグラフに反映させない方法

以下の点でどなたかお教えください。

H18.1~H20.12までの毎月の売上高を表に記載し、その表を元にグラフを作成しています。グラフに反映させる表の範囲はH18.1~H20.12の全てです。
そのためまだ経過していない期間のセルが空白になり、そこがグラフに反映され見づらくなります。
データを入力する都度グラフの範囲を変更すればいいのですが、うまく算式や設定等で空白や0円となっているセルをグラフに反映させない方法はありますか?

お手数ですが、よろしくお願いいたします。

Aベストアンサー

売上高のセルは数式で求められているのですよね?
それなら
=IF(現在の数式=0,NA(),現在の数式)
としてみてください。
つまり、0の場合はN/Aエラーにしてしまうんです。N/Aエラーはグラフに反映されません。

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

Q3σ法による計算式

当方、管理や統計学など全く無知ですのでわかりやすく教えて下さい。

仕事で、管理図を作成するにあたり、3σ法で管理限界線(UCL,LCL)を計算せよとの事を言われましたが、理解出来てません。

3σ法の公式とかあるんでしょうか?あったら教えて下さい。あと、3σとは何か、簡単に教えて下さい

Aベストアンサー

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため)
4)それを、(データの数-1)で割る(気持ちとしては、ばらつきの量を平均した感じ・データの数-1で割るのは、「母標準偏差の推定」という考え方があるから)
5) 3)でばらつきを2乗しているので、それをルートで開いて元に戻す

とうことになります。

統計上いくつかの前提があって、例えば、製造工程で普通にものを作った場合、いろいろなばらつきは、それぞれ独立に出ます。
そこで、結果的には、ある一定の平均値付近のものが多くでき、平均値から外れたものは、少しだけどできるという形になる場合が多いのです。
この場合、誤差が本当の意味での「ばらつき」であれば、これは、「正規分布」という分布(つまり、平均値付近が多く、それから離れると少なくなっていくような)をします。

この「正規分布に従う」という前提で、平均値±3σの間には、全体の、99%強 が含まれるというのが、統計的に知られています。
これを以て、3σで管理という事になります。


さて、「管理図」ということですが、いろいろな種類のものがあります。
そこで、普通は、UCL, LCL は、製品自体の規格値(か、それから算出された値)を使うので、直接、3σは出てこない気がするのですが。
考えられるのは、x-s (平均と、標準偏差の管理図)で、標準偏差に対する上限管理値が3σなのかなと。(この場合、下限の管理値はありません。0が理想なので)

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため...続きを読む

Q正規分布とヒストグラムのグラフの書き方

エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。
しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。
具体的に書いていきたいと思います。
正規分布になるとほぼ確信しているデータがあります。
サンプル数は50、平均7.8、標準偏差2.9のデータです。

データ区間 頻度
0       0
1       1
2       1
3       2
4       2
5       5
6       6
7       6
8       6
9       8
10      5
11      2
12      3
13      1
14      2
15      0

というデータです。
そして、データ区間に対応する正規分布の値を
NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE)
を使用して、求めます。
そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。
(ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?)
上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが)
また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。
以上の作業で、求めていたグラフは書けました。
視覚的に予想通り正規分布のグラフに近いことが分かりました。

さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。
そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。
度数分布表は以下のようになります。
データ区間 頻度
1       1
3       3
5       7
7       12
9       14
11      7
13      4
15      2
17      0
ここから、前回同様の作業でヒストグラムは容易に描けます。
正規分布のグラフはどのように書けば良いのでしょうか?
前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。
正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。
データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。
すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。
しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。
このようにして得られてグラフに問題は無いでしょうか。
また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。
数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。
どのように考えればよいのでしょうか。

質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。
お手数をおかけしますが、よろしくお願いします。

エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。
しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。
具体的に書いていきたいと思います。
正規分布になるとほぼ確信しているデータがあります。
サンプル数は50、平均7.8、標準偏差2.9のデータです。

データ区間 頻度
0       0
1       1
2      ...続きを読む

Aベストアンサー

以前、同じような質問に回答したことがあるなあと思って、回答履歴を探しました。
http://okwave.jp/qa2887190.html

これの#2の方法で良いかと思います。
ポイントは
× NORMDIST(データ,平均,標準偏差,FALSE)
○ NORMDIST(データ,平均,標準偏差,TRUE)

正規分布は確率分布なので、グラフの面積は「1」つまり全体で100% ということです。
なので、データ数(50)倍します。

3~5のデータ区間なら、その区間に全体の何% 入るかを算出する必要があります。
算出方法は、=NORMDIST(5,・・・,TRUE)-NORMDIST(3,・・・,TRUE)
「~5まで」マイナス「~3まで」で、「3~5」のデータ区間の正規分布の確率が算出できます。
それをデータ数倍すればOKです。

Q正規分布に従わないと標準偏差の算出は向かないでしょうか?

正規分布に従うとは、平均値の分布が多いという意味でしょうか?

日々変わるデータの点数が凸のような分布でなく、平均値付近が少ない
凹のようなデータの集合だと、標準偏差を算出し正規分布を使い
30%以下の人や70%以上の人を毎日抽出するような用途には
向かないのでしょうか?

Aベストアンサー

まず、正規分布に従うとは、「分布が正規分布のグラフと同じ形をする事」をいいます。
そのため、平均辺りが多くても△のような分布グラフだったり、
左右が対象でないと、「正規分布に従う」とは言いません。

そのため、試験の成績などは、「正規分布に近い」だけであって、
「正規分布に従っている」のではありません。

つまり、「偏差値」を使うべきかどうかは、偏差値の「分かりやすさ」と、
その分布が正規分布に近いかどうかの判断になります。



例えば、凹のようなデータでも、両端がなだらかになっていれば、そこそこ偏差値も使えます。

逆に、両端が崖のようになっていると、偏差値を使うのは控えた方がいいでしょう。
(たとえば、30点や、80点の人は多いけど、29点以下や、81点以上がいないなど)

また、分布が左右対称でない場合も、使用をやめた方がいいでしょう。
平均値と、中央値(順位が真ん中の人の値)が離れると、偏差値の感覚的な値とは
ずれてきます。



いずれにしても、ある程度のデータがあるのであれば、そのデータで
やってみるのが一番です。

出るべき結果と大きなずれがなければ、分かりやすいので使ってしまっても
いいのではないでしょうか。

試験の結果なんかでも、山が二つあったり、左右に偏っている事なんて
よくあります。

それでも、偏差値が、それなりに機能していますから、まずはやってみるのが
いいのではないかと思います。

まず、正規分布に従うとは、「分布が正規分布のグラフと同じ形をする事」をいいます。
そのため、平均辺りが多くても△のような分布グラフだったり、
左右が対象でないと、「正規分布に従う」とは言いません。

そのため、試験の成績などは、「正規分布に近い」だけであって、
「正規分布に従っている」のではありません。

つまり、「偏差値」を使うべきかどうかは、偏差値の「分かりやすさ」と、
その分布が正規分布に近いかどうかの判断になります。



例えば、凹のようなデータでも、両端がなだら...続きを読む


人気Q&Aランキング