

現在、仕事で必要のため大変困っています。
大量のデータ(物件の見積金額)のばらつきを出すために「STDEVP」関数を用いて「標準偏差」を出しました。
この標準偏差というのは、よくある「山のようなグラフ」(すみません、名前がわかりません)の平均からどれだけ離れているか・・・ということをみるものでよかったでしょうか?
また、この標準偏差に「通常の範囲」というのはありますか?たとえば「マイナス」にはならないとか100以上の数値はない・・・など
そしてこのデータを「山のようなグラフ」にして見た目にすぐにわかるようにしたいのですが、どのようにしたら良いですか?
くだらないご質問だとはお思いでしょうが、なんとかお力を貸してください。
No.6ベストアンサー
- 回答日時:
>よくある「山のようなグラフ」
●正規分布グラフのことでしょう。
●標準偏差は、1峰の山型分布に限らず、平均を出せるデータがあれば(また平均はどんな場合でも出せますから)
(データ-平均)の2乗を全てのデータに亘って加えた
(Σ)もの(分散)から計算するからです。その平方根(+の方を採る約束)です。(不偏分散に付いては略)
●正規分布かそれに近い分布でないと、「もの」(推論)が言えないだけです。(例えば「平均値 ± 1 標準偏差の範囲内には全データの 68.27% が含まれる」など)
誤差に関係するようなものは使えます。正規分布以外の分布は沢山あります。むしろ正規分布が特殊でしょう。
>この標準偏差に「通常の範囲」というのはありますか
プラス値であることだけです。値について、1より小とかの原理的範囲はありません。公式から判ります。データが2個しかないと仮定して、仮定で平均を決め、平均+α、平均-αのαの値を大きくすればいくらでも「分散」値は大きくなることで判ります。
>そしてこのデータを「山のようなグラフ」にして
現実データの現実分布の形によるのです。無理に山のような形に出来るものでもなく、して良いものでもありません。
現実の分布の形が「まずありき」であって、現実をモデル
分布に強引に当てはめては、本末顛倒です。
経験的に理論的に正規分布をするはずのものが、そうなっていない時には、QC活動でおなじみの、何か外因的作用(機械の故障)や何かの要因が加わっていると、疑うわけです。試験成績であれば、あるクラスではその出題関連単元を教え、他のクラスでは教えなかったとか、カンニングが行われたのではないか、問題があまりにも易しすぎたのではないかなど。
パチンコの例の解説がありました。
http://www.yi-web.com/~ps/java/kakuritu_syoho11. …
http://www.yi-web.com/~ps/
小生はダメですが、この方面に興味があれば理解のキッカケが掴めるかも。
No.5
- 回答日時:
補足拝見しました
標準偏差は、ある特定の数値の集合に対して
そのばらつき具合を与えるものです。
ですから、平均値が同じ物同士なら比較する事が
できます。
でも、
たとえば、ある地域の平均価格が100円、
別の地域だと50円というときに、
それぞれの地域毎にばらつき具合を
調べる時にはそのままでは使えません。
一方、偏差値は、この標準偏差と平均を利用して
平均的なもの=50 に固定することで
平均値が違う物同士でも平均値からのばらつきを
比較できるようにするものです。
どちらが良いかは一長一短ありますが、
ご質問の例では、これらにとらわれずに
積み上げ折れ線グラフで良いのでは?と思います。
具体的には、
縦軸は%で、最大は100%、
販売してくれる会社の割合となります。
横軸は価格です。
こうすると、安いところは左に、高い所は右に出ます。
で、一番高い価格を提示すればどの会社からも
買えますから、そこが100%です。
つまり、グラフの傾き=散らばり具合
グラフの位置=全体的な価格の高低
という形になります。
これを標準偏差を用いて表す場合は、
単純に数値にして
平均=価格の高低
標準偏差=価格の散らばり具合
ということになりますが、
散らばり具合だけだと、
最低価格(これは誰でも興味あるでしょう)が
見えて来ないという欠点があります。
この回答への補足
何度もありがとうございます。
アドバイスにありましたような「積み上げ折れ線グラフ」というのを試してみようと思ったのですが、
>具体的には、
>縦軸は%で、最大は100%、
>販売してくれる会社の割合となります。
>横軸は価格です。
この縦軸の「%」というのは「会社の割合」とありますがどのように算出されるものでしょうか?
また、今回は最低価格というのを見るわけではなく
平均からどれだけ離れているか・・・というのが
見たいのだそうです。
よろしくお願いします。
No.4
- 回答日時:
標準偏差は統計的には優れたものですが、
普通の範囲を比較する時には
ちょっと直感的では無いようで、
こういう場合は受験で有名な
偏差値の方がわかりやすいです。
偏差値=(X-平均値)/標準偏差*10+50
という式になります
NO.3の方の標準偏差の上下3倍というのは、
偏差値では80~20に相当します。
偏差値で80以上、または20以下というのは
普通ありえませんね。
受験で言えば、偏差値70以上、30以下
つまり標準偏差の2倍を超えた数値は
もう、母集団の形で数値が変ってしまうので
事実上つかえません。
ここらへんは何の「通常の範囲」なのかで
変ると思います。
この回答への補足
ご回答ありがとうございます。
具体的に「標準偏差」と「偏差値」の違いというのはあるのでしょうか?
今回出したいのは、
たとえば
愛知県にある5社の会社がA商品について見積金額を出しました。
その見積金額というのは、5社の平均と比べてみてどれだけばらけているものなのか・・・ということを出したいのです。
そしてそれを視覚的に訴えるために、「ヒストグラム」のようなグラフにできないか・・・
A商品は愛知県だけでなく岐阜県でも三重県でも見積をとるので各県での違いというのもみてみたい。
ご回答いただいてずうずうしいとは思いましたが、もし何かアドバイスがありましたらお願いいたします。
No.2
- 回答日時:
#1です。
何度もすみません。下記回答に誤りがありました。平均±標準偏差の範囲に含まれるのは68.26%だそうです。(参考URL)ちなみに標準偏差についての考え方ですが、参考URLに正規分布表が載っています。標準偏差(σ:シグマ)とは、平均から正規分布表の変曲点までの距離を示しています。ですから、完成した度数分布表がきれいな正規分布を示していたら、そのグラフの変曲点が標準偏差であると視覚的にとらえることが可能です。(もちろんSTDEVで計算された標準偏差が正確な値です。)
参考URL:http://procgtw.mach.bio.mie-u.ac.jp/Seminar/Semi …
No.1
- 回答日時:
専門家でも何でもないのですが、お困りのご様子なので来てしまいました。
間違っている情報もあるかも知れませんので、必ず他の方の回答も参考にしていただければ幸いです。標準偏差は、集団のデータのばらつきを示す数値です。
たとえば、2つのグループA・Bに、0から100までのデータがそれぞれ150個・200個あったとして、両グループとも平均値が50だったとします。
Aグループの平均±標準偏差が50±10
Bグループの平均±標準偏差が50±20
である場合、Bグループの方がばらつきが大きいと評価されます。ということで、プラスとマイナスの両方のデータがありますし、平均値の大きさによって100とか1000とか小数点の数値ももちろんありえます。
グループのデータの分布が正規分布を取る場合、平均±標準偏差の範囲に、全体の個数のうち66%のデータが入ると考えられます。つまり、Bグループは50±20ですから、30から70というデータ範囲内に132件のデータが分布しているといえます。
さて、山のようなグラフは「度数分布表(ヒストグラム)」といいます。これは標準偏差の算出とは無関係です。エクセルをお持ちでかつアドインがインストールされていれば、ツール→分析ツール→ヒストグラムで書くことが出来ますが、アドインを使用しなくても、frequency関数を使うことで度数分布表をグラフで書くことが出来ます。詳細は参考URLをご覧下さい。
ただし、きれいな山形にするには階級値の設定が重要で、たとえば上記のデータの場合、階級値を5にするか、10にするかでできあがるグラフの形が全く異なります。この点はある程度の経験が必要になるそうですので、山形にならない場合は何度か階級値幅を適当に変えて試してみてください。
参考URL:http://www.tokuyama.ac.jp/home/~n-harada/statist …
まだしっかり内容は把握しておりませんが、とりあえずお礼をさせていただきます。
グラフは「ヒストグラム」ですね。アドインで分析ツールはありますのでとりあえずやってみます。
ありがとうございました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 統計量および正規分布と分散の加法性の演習問題です。 5 2023/07/29 10:46
- 統計学 確率統計でExcelの使い方を教えてください。 3 2022/07/27 19:21
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- 統計学 直線の傾き(回帰係数)から相関係数を計算できるのでしょうか? 2 2022/09/16 19:28
- 統計学 統計学についての質問です。 2標本問題で A: サイズ32 平均62.2 標準偏差11.0 B: サ 2 2023/02/08 14:15
- 統計学 生物統計学の質問 7 2022/05/17 13:59
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 統計学 教えて数学! 標準偏差 2 2023/03/30 22:41
- 統計学 確率統計です。 1 2022/07/27 23:14
- 統計学 【統計】標本平均、標本標準偏差からt分布グラフ作成方法 9 2022/10/18 23:46
関連するカテゴリからQ&Aを探す
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
標準偏差
-
幾何標準偏差の求め方
-
偏差値だけで見ると、鳥取大学≧...
-
Excelで近似式の標準偏差を算出...
-
偏差値の求め方(逆の場合)
-
平均年齢の表記方法(統計学的に)
-
安全在庫=安全係数×√(リードタ...
-
永野芽郁さんは、顔面偏差値い...
-
偏差値から順位を求めるには
-
(1)で分散を求める時、解答では...
-
なぜ共分散はSxyで表すのですか...
-
パーセンテージのバラツキを表...
-
社会人の偏差値の調べ方
-
顔面偏差値100点満点中何点ぐら...
-
中学1.2年で5教科の合計点が350...
-
proportion of variationは分散...
-
ExcelでCVを計算するには
-
高校偏差値67ってどのくらい字...
-
今日数学のテストが返ってきて ...
-
偏差値の出し方(少人数の場合は?)
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
標準偏差
-
社会人の偏差値の調べ方
-
(1)で分散を求める時、解答では...
-
推定(統計)です。有効数字の...
-
偏差値60の人と偏差値50の人が...
-
Excelで近似式の標準偏差を算出...
-
幾何標準偏差の求め方
-
パーセンテージのバラツキを表...
-
偏差値の求め方(逆の場合)
-
偏差値から順位を求めるには
-
顔面偏差値100点満点中何点ぐら...
-
なぜ共分散はSxyで表すのですか...
-
高校偏差値67ってどのくらい字...
-
中学1.2年で5教科の合計点が350...
-
小さければ小さい程高い偏差値
-
加重平均偏差値 とは、どんな偏...
-
標準偏差を求める際のデータ数...
-
安全在庫=安全係数×√(リードタ...
-
平均年齢の表記方法(統計学的に)
-
ExcelでCVを計算するには
おすすめ情報