【復活求む!】惜しくも解散してしまったバンド|J-ROCK編 >>

こういった正規分布のグラフをエクセル上で作るにはどうすればいいのでしょうか?
与えられた条件は
μ=0,σ=1の時、
μ=1,σ=1の時、
μ=0,σ=2の時、について,xとf(x)の関係をグラフ化するです。

このQ&Aに関連する最新のQ&A

A 回答 (1件)

 基本を理解した上で、エクセル上でグラフを作るには、各々の条件で xの値をいろいろ変えて、関数



    f(x) = NORMD.IST(x,μ,σ,関数形式)

の値を計算し、x を横軸に、f(x) を縦軸に「線グラフ」でグラフ化すればよいだけです。

 xの値をどのようにとればよいかは、μ、σ の意味を理解していれば分かるはずです。
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qエクセルで正規分布の作り方

色々紹介はされているとは思いますがいまいち作成方法がわかりませんので教えてください。
n=50で得点の正規分布図をエクセルで作成したいのですが具体的にどういう順番で処理すればよいでしょうか?よろしくお願いします。

Aベストアンサー

正規分布の曲線をプロットしたいのでしょうか?

エクセルの関数を使う方法はこちら
http://home.kanto-gakuin.ac.jp/~ahero/excel/func/norm_graph.shtml
曲線の方程式からプロットする方法はこちら
http://oshiete.goo.ne.jp/qa/853670.html

でも、平均値と標準偏差が解らないと描けないですね。
ご質問の意味が、得点と、頻度をプロットしたグラフという事なら、
単に、折れ線グラフだと思います。
具体的なデータ等補足していただかないと、的確な回答は付かないと存じます。

こんなサイトを見つけましたが、なかなか面白そうです。
http://homepage1.nifty.com/gfk/excel.htm
http://homepage1.nifty.com/gfk/average.htm

Q正規分布とヒストグラムのグラフの書き方

エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。
しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。
具体的に書いていきたいと思います。
正規分布になるとほぼ確信しているデータがあります。
サンプル数は50、平均7.8、標準偏差2.9のデータです。

データ区間 頻度
0       0
1       1
2       1
3       2
4       2
5       5
6       6
7       6
8       6
9       8
10      5
11      2
12      3
13      1
14      2
15      0

というデータです。
そして、データ区間に対応する正規分布の値を
NORMDIST(あるデータ区間の値,平均,標準偏差,FALSE)
を使用して、求めます。
そして、得られた正規分布の値をそれぞれ、サンプル数(50)倍します。
(ここでサンプル数倍するという作業は、NORMDIST(データ,平均,標準偏差,FALSE)で描かれるグラフの面積は1なので、今書きたいヒストグラムとサイズをあわせる…という理解でよろしいのでしょうか?)
上述の度数分布表から棒グラフ→データ系列の書式設定→オプションで棒の間隔を0にすることでヒストグラムを描きました。(分析ツールを用いても良かったのですが)
また、同グラフに新たな系列を増やし、NORMDIST*50によって得られた値を導入し、こちらは、グラフの種類→マーカーの無い線グラフ→データ系列の書式設定→パターン→スムージングを選択することによって、正規分布のグラフを書きます。
以上の作業で、求めていたグラフは書けました。
視覚的に予想通り正規分布のグラフに近いことが分かりました。

さて、ヒストグラムを使用する際によく行われる作業ですが、上述の度数分布表みたいに、データ区間を1刻みにするより、大きくしたほうがデータの性質がより見てとれることがあります。
そのため、ここでも、データ区間を広げ、2刻みにした場合のグラフを描こうと思いました。
度数分布表は以下のようになります。
データ区間 頻度
1       1
3       3
5       7
7       12
9       14
11      7
13      4
15      2
17      0
ここから、前回同様の作業でヒストグラムは容易に描けます。
正規分布のグラフはどのように書けば良いのでしょうか?
前回同様、NORMDIST*50から得られる値を利用しても、ヒストグラムの棒の高さが前回より高いので、全く合いません。
正規分布関数は定数倍しても性質が変わることはないので、実験的に50以外の値を導入してみました。
データ区間が2倍になったから、*50を更に2倍して、*100にしてみようか、という安易な考えのもと、NORMDIST*100を使用したグラフを書いてみました。
すると、ヒストグラムと正規分布の形が視覚的に似て見える、というもっともらしいグラフは得られました。
しかし、安易にNORMDIST*100を導入したことに疑問と不安を覚えます。
このようにして得られてグラフに問題は無いでしょうか。
また、データ区間を変更したとき、NORMDISTを何倍してやると良いなどというのはあるのでしょうか。
数理統計もエクセルも初心者なので、得られたグラフに自信がないのです。
どのように考えればよいのでしょうか。

質問文が非常に長くなってしまい、申し訳無いのですが、わかる方、お教えいただけないでしょうか。
お手数をおかけしますが、よろしくお願いします。

エクセルで正規分布とヒストグラムをひとつのグラフとして表そうとしています。過去の質問や他のページを調べた結果、ある程度書き方を理解して、求めるグラフが書けました。
しかし、ヒストグラムのデータ区間を変えたとき、どのように対応すればよいのか分からなくなりました。
具体的に書いていきたいと思います。
正規分布になるとほぼ確信しているデータがあります。
サンプル数は50、平均7.8、標準偏差2.9のデータです。

データ区間 頻度
0       0
1       1
2      ...続きを読む

Aベストアンサー

以前、同じような質問に回答したことがあるなあと思って、回答履歴を探しました。
http://okwave.jp/qa2887190.html

これの#2の方法で良いかと思います。
ポイントは
× NORMDIST(データ,平均,標準偏差,FALSE)
○ NORMDIST(データ,平均,標準偏差,TRUE)

正規分布は確率分布なので、グラフの面積は「1」つまり全体で100% ということです。
なので、データ数(50)倍します。

3~5のデータ区間なら、その区間に全体の何% 入るかを算出する必要があります。
算出方法は、=NORMDIST(5,・・・,TRUE)-NORMDIST(3,・・・,TRUE)
「~5まで」マイナス「~3まで」で、「3~5」のデータ区間の正規分布の確率が算出できます。
それをデータ数倍すればOKです。

Qexcelで正規分布図

タイトルの通りなんですがexcelで正規分布図を作りたいのですが作り方がわかりません。教えてください!標準偏差と平均値は出ています。

Aベストアンサー

No.1です。。
No.1からNo.3は見なかったことにしてください。
今度こそ完全版です。

1.セルA1に期待値をセルB1に標準偏差を設定します。
2.C列に変数xを一定間隔である程度設定します。
3.D列に正規分布の密度関数を設定し、同じ行のx(C列)を代入します。
正規分布N(μ,σ^2)の密度関数は
f(x)=1/√2πσe(-(x-μ)^2/2σ^2))
ですので、D列には
=1/(SQRT(2*PI())*B$1)*EXP(-((C?-A$1)^2)/(2*(B$1^2)))
を記述します。(C?は同じ行のx)
4.D列からグラフを作成します。

グラフはデータポイントを平滑線で結んだマーカーなしの散布図にし、Xの値でC列を指定してください。

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q正規分布表

標準正規分布表(下側確率や上側確率)について
例題が
①ZがN(0、1)に従うとき、P(Z≧1.25)
② ZがN(0、1)に従うとき、P(Z≧z)=0.15となるz

になっていたのですが、この時のpやzはどういったものを指して、何をすれば答えが求まるのでしょうか?
これも正規分布の一種ですか?また、エクセルを使って正規分布のグラフを書く練習をしていますがそれと関係があるのでしょうか?

よろしくお願いします!

Aベストアンサー

う~ん、正規分布の基本を理解せずに、機械的にエクセルで図を描いても意味がないですよ。

 正規分布の基本を、きちんと教科書で勉強してください。
 簡単に見たいなら、zやPの説明はこちらにあります。
http://www.geisya.or.jp/~mwm48961/statistics/stddiv1.htm

 zは、平均値からのズレ(偏差)ですが、標準偏差を「1」と規格化した「標準正規分布」における平均値からの偏差です。

 P(z)は、平均値からの偏差zに対する「確率密度」、つまり質問の図に書いてあるカーブの「zにおける高さ」に相当します。
 ただし、普通はある範囲の確率(=累積分部:図の色塗りした面積に相当)を求めたいので、これをP(a<z<b)のように書きます。

 エクセルでは、
  NORMDIST(x,μ,σ,関数形式):
で設定すると思いますが、xは規格化されていない変数、μは平均値、σは標準偏差、関数形式は「FALSE=確率密度関数」「TRUE:累積分布関数」です。

 μ=0、σ=1 としてものが「標準正規分布」です。

>これも正規分布の一種ですか?また、エクセルを使って正規分布のグラフを書く練習をしていますがそれと関係があるのでしょうか?

 正規分布そのものです。エクセルで、何をお書きなのでしょうか。きちんと勉強してくださいね。

う~ん、正規分布の基本を理解せずに、機械的にエクセルで図を描いても意味がないですよ。

 正規分布の基本を、きちんと教科書で勉強してください。
 簡単に見たいなら、zやPの説明はこちらにあります。
http://www.geisya.or.jp/~mwm48961/statistics/stddiv1.htm

 zは、平均値からのズレ(偏差)ですが、標準偏差を「1」と規格化した「標準正規分布」における平均値からの偏差です。

 P(z)は、平均値からの偏差zに対する「確率密度」、つまり質問の図に書いてあるカーブの「zにおける高さ」に...続きを読む


人気Q&Aランキング