![](http://oshiete.xgoo.jp/images/v2/pc/qa/question_title.png?5a7ff87)
よろしくお願いします。
データのバラツキ、なんと言ったら良いのでしょうかバラツキ具合と言えば良いのでしょうか、それを数値で表す方法を知りたいのですがよく分かりません。
100を狙った時に
110
115
120
115
130
というデータと
100を狙ったときに
98
99
101
97
102
とでは明らかに後者のほうが精度が高いと言えると思いますが
このことを数値で表すにはどうすれば良いのでしょうか
エクセルで散布図を描くとx軸の数値は100しかありません
Y軸の数値は前者は当然バラツキが大きいのですが、とても変な散布図になってしまいます。こんな散布図ってそもそもあるのでしょうか。
それ以前に散布図で表すことに無理があるのでしょうか。
うまく表現できていないために理解に苦しむ点も多いと思いますが
どなたか教えてください。
No.2ベストアンサー
- 回答日時:
普通、度数分布グラフを描きますが、データ数が少ないので、平均やバラツキなどを直接計算して、数値で比較するのが良いと思います。
【平均と標準偏差(バラツキ)の計算】
(1) 最初のデータ組(110,..,130)をExcelのA列(A1~A5)に貼り付ける→ A6のセルに' =AVERAGE(A1:A5)'を記入(' 'は書かない)してEnter→A7のセルに' =STDEV(A1:A5)'を記入してEnter
(2) 次のデータ組(98,..,102)をExcelのB列(B1~B5)に貼り付ける→ B6のセルに' =AVERAGE(B1:B5)'を記入(' 'は書かない)してEnter→B7のセルに' =STDEV(B1:B5)'を記入してEnter
【結果】
(1) 平均 118、標準偏差 7.58
(2) 平均 99.4、標準偏差 2.07
狙い目との差(平均-ねらい目)、標準偏差(平均からのばらつき)いずれも(2)のほいが小さいので(2)のほうが精度が高い。
分析オプションを使う方法もありますが、説明しづらいので、最も簡単な方法を紹介しました。
この回答への補足
親切に教えていただきましてありがとうございます。
私の説明が足りませんでした。
タイトルでは「狙った値からのずれ」と言っておきながら
質問では「ばらつき」という表現を使ってしまいました。
申し訳ありませんでした。
教えていただきたいのは「狙った値からのずれ」です
1回目100を狙って 93、102、101、 97、135と
2回目100を狙って120、120、121、120、119とでは
あきらかに2回目はバラツキは少ないですが評価としては最悪です
1回目のデータには135という狙った値と大きくずれた値が一つありますがそれでも評価は最高レベルです。一回の大きなミスよりも
4回が安定して狙った値に近い値を出しています。
詳しく教えていただきましてありがとうございました。
狙い目との差(平均-ねらい目)、標準偏差(平均からのばらつき)
この違いがやっと理解できました。ありがとうございました。
印刷保存して大事に使わせていただきます。
No.5
- 回答日時:
誤差について、区別されていないようなので。
誤差を、正度と確度にわけると分かりやすいと想います。時計を例にすると、
毎日12時に時計をみると、いつも12時前後を指している。しかし、12時10分だったり、11時45分だったり、のように平均値は12時ごろというのを、正度は良いが確度は悪いと表現します。
一方、12時ピッタリだったのに、次の日は13時、次の次の日は14時のように、確実に毎日1時間ずつ進む時計を、正度は悪いが確度は良い、と区別します。
さて、正度は、平均値で表します。平均値が想定した値、すなわち、この場合100に近ければ近いほど正度は良いわけです。
確度は、バラツキといわれる標準偏差が代表的なものです。
グラフでは、正度は棒グラフなら高さであらわし、100の値が必要なら、横の線でも入れてください。
確度は、棒グラフのてっぺんから、標準偏差に相当する値の線を引きます(上下、もしくは上方のみ、場合によっては下へ)。エクセルヘルプで、「誤差」で検索してください。
これは、生物系の論文なら、必ずすることです。棒グラフでも、折れ線グラフでも、バラツキを必ず線で示しています。線はTのような形をしている場合もあります。また、その値は私は標準偏差を使いますが、標準誤差で表す人もいます。生物系の論文に目を通されるか、どなたかに訊いて下さい。
バラツキが標準偏差では駄目な場合は、一つ一つのデータを点で示します。これもありふれたグラフですので、「百聞は一見にしかず」で、生物系の論文をパラパラめくって下さい。
詳しく例をあげて教えていただきまして大変ありがとうございます。
確かに正度と確度の違いをよくわかっていませんでした。
大変勉強になりました。
No.4
- 回答日時:
回答ではなく,ANo.2・ANo.3を読んでの疑問です。
「狙った値」からのずれ,という質問なのに,なぜ平均を求めているのでしょう。
(a)100を狙った時のデータ
110,115,120,115,130
(b)100を狙った時のデータ
120,120,120,120,120
後者の(b)はバラツキがまったくなく「平均からの偏差」はゼロですけれど,「狙った値からの偏差」の合計は,
(a)10+15+20+15+30=90
(b)20+20+20+20+20=100
となり,(b)の方が狙った値からより外れているように思えます。
(実用上は,狙う位置を最初から-20調整すればよいので,(b)の方が優秀だと思いますが)
平均の代わりに狙った値を使うだけですから計算は簡単でしょうけれど,おそらくそれは標準偏差とは呼ばないですよね。なにか呼び名はあるのでしょうか?
アドバイスありがとうございます。
タイトルと質問内容が完璧に違っていたために
回答者の方に迷惑をかけてしまいました。
ご指摘のとおり「狙った値からのずれ」を知りたいと思います。
No.3
- 回答日時:
バラツキ具合を数値で表すのは標準偏差で求めます。
検索したらいろいろと求め方の式は調べられます。http://www.aichi-gakuin.ac.jp/~chino/psycstat/ch …
噛み砕いて計算手順を挙げると、
第一、平均を求めます。
110、115、120、115、130 の平均は、118
第二、各値との平均の差を求めます。
-8、-3、2、-3、12
第三、各々の値を二乗します。
64、9、4、9、144
第四、これらの値の平均を出します。
(64+9+4+9+144)÷5は、46
最後に、この値の平方根を取ります。
√46は、6.782329983
同じように、98、99、101、97、102 の場合で標準偏差を求めると、
1.854723699
となり、小さい方がバラツキが小さいことが分かります。
全部の数が同じ場合は、バラツキがないので、標準偏差は、0 になります。
散布図は、2つの数の相関(例えば、身長と体重等)を見るためのもので、上記の例の場合には標準偏差を求める方が適切だと思います。
他に、上位四分の一と、下位四分の一の差でバラツキを出す、四分位偏差っていう方法もあります。
この回答への補足
親切に教えていただきましてありがとうございます。
私の説明が足りませんでした。
タイトルでは「狙った値からのずれ」と言っておきながら
質問では「ばらつき」という表現を使ってしまいました。
申し訳ありませんでした。
教えていただきたいのは「狙った値からのずれ」です
1回目100を狙って 93、102、101、 97、135と
2回目100を狙って120、120、121、120、119とでは
あきらかに2回目はバラツキは少ないですが評価としては最悪です
1回目のデータには135という狙った値と大きくずれた値が一つありますがそれでも評価は最高レベルです。一回の大きなミスよりも
4回が安定して狙った値に近い値を出しています。
詳しく教えていただきましてありがとうございます。
お陰様で標準偏差がどのような計算ででてくるのかよく理解できました。また散布図を使うケースをわかりやすい事例を上げて教えていただいてよく理解できました。今度のデータは散布図ではだめだということがよくわかりました。大変勉強になりました。ありがとうございました。
No.1
- 回答日時:
数値は、まずは標準偏差(σ)を計算するんでしょうね。
http://www.pursue.ne.jp/Document_xls/xls0023.htm
図を描く場合は、Yの値で単純にヒストグラムを描けばいいのでは。
http://home.kanto-gakuin.ac.jp/~ahero/excel/hist/
もしくは、相対誤差 Y/X の標準偏差なり、ヒストグラムを描くなりしたほうが、いい場合もあるかもしれません。
この回答への補足
アドバイスありがとうございます
実際のデータは二回で各30近くあります
グラフ用紙にプロットすると見た目ではどちらがずれが小さいか一目瞭然なのですが、これを数値で示すのが分かりませんでした
散布図はなんかおかしいなあとは思っていたのですが
教えていただきましたヒストグラムに挑戦してみようと思います
何年か前にもQCで習った覚えはあるのですがどうもうろ覚えで
身についていません。頑張ってやって見ます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 数学 数学 2変数データで、「相関係数=−1」の散布図を書く際 写真に これら5組のデータの散布図を描くと 4 2023/02/15 10:46
- C言語・C++・C# このプログラミング誰か教えてくれませんか 1 2022/06/02 15:27
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 統計学の問題です よろしくお願いします 代表値 次の15件のデータについて,以下の問いに答えよ。 結 1 2023/01/31 18:53
- 統計学 統計学の問題です よろしくお願いします 代表値 次の15件のデータについて,以下の問いに答えよ。 結 5 2023/01/31 23:35
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
- 統計学 確率の問題です。 7 2022/05/07 01:08
- 統計学 確率統計でExcelの使い方を教えてください。 3 2022/07/27 19:21
- Excel(エクセル) 図のような散布図の作り方を教えてください。 1 2022/07/19 11:52
- 数学 ポアソン分布と二項分布について ・ポアソン分布における期待値と分散は等しくならない場合がある。 ・二 1 2022/06/12 16:29
このQ&Aを見た人はこんなQ&Aも見ています
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
統計学の問題なんですが・・・
-
加重平均(重み付き平均)の標...
-
標準偏差の平均値の求め方
-
標準偏差について詳しい方お願...
-
バラツキを考慮して平均を補正...
-
[Excel]VBAを使って各クラスの...
-
サラリーマンの月平均お小遣い...
-
EXCELで0をカウントしないで平...
-
計数秤での員数不足対策について
-
ガウシアン平均フィルタによる...
-
確率統計学
-
データの加重平均について
-
数学1の、データの分析の、相関係...
-
アンケート集計で、満足度の平...
-
N個の一様乱数[0,1]の平均の分布
-
縦計算と横計算で平均が合わない。
-
比率(%) の平均値を算出する場...
-
平均値が合わないのは何故でし...
-
クラスの人数と平均点のみから...
-
5教科のテストそれぞれの得点か...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
統計学の問題なんですが・・・
-
加重平均(重み付き平均)の標...
-
標準偏差の平均値の求め方
-
標準偏差について詳しい方お願...
-
標準偏差の「数値」による判断...
-
統計学の二乗平均がわからない
-
バラツキを考慮して平均を補正...
-
平均-3σの考え方を教えてくださ...
-
EXCELで0をカウントしないで平...
-
データの加重平均について
-
縦計算と横計算で平均が合わない。
-
比率(%) の平均値を算出する場...
-
S管理図の管理限界線の求め方に...
-
【数学・標準偏差σ】標準偏差の...
-
計数秤での員数不足対策について
-
クラスの人数と平均点のみから...
-
標準偏差の計算方法
-
平均値と標準偏差からテストデ...
-
標準偏差について
-
標準偏差と平均偏差の違い
おすすめ情報