出産前後の痔にはご注意!

サンプルの平均値と上限値と下限値から標準偏差を予測することはできますか。
平均値と標準偏差を用いて統合解析を行いたいのですが、標準偏差の代わりに上限値と下限値が記された文献情報の取り扱いに苦慮しております。
確度は低くても一般的にこんなのがあるよ、というような情報をご教授下さい。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

厳密には無理ですが,ある程度推定することはできます。



サンプルの個数が非常に多い場合で,上限値下限値がわかっている場合には上限値,下限値を3シグマと見てよいと思われます。
この場合には平均値は上限値と下限値の中央に来ているはずです。

これは平均±3シグマに99.7%が入るのでほとんどすべてと見てよいからです。
http://www.sci.kagoshima-u.ac.jp/~itls/Japanese/ …

平均が上限値,下限値の中央に無い場合にはサンプル数が少ないことを意味しており,上限値,下限値を3シグマと考えてはまずく,シグマとか2シグマと見なす必要がある(つまり標準偏差は大きい)と思います。

この回答への補足

平均が中央にないばあいは推定は難しい、ということですね。

補足日時:2007/12/21 10:32
    • good
    • 0

理論上はできます。

しかし、データ数が少なければ、それだけ精度が悪いし、多ければ、情報をムダに捨てていることになるので、よほどのことがなければ、範囲(R)から標準偏差(σ)を推定することはありません。
たしか「R管理図法」の理論の中で、計算式を見たことがあります。

この回答への補足

R管理図法なるものを聞いたこともないような統計素人ですが、可能性があるということなので勉強してみようと思います。

補足日時:2007/12/21 10:29
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Q3σ法による計算式

当方、管理や統計学など全く無知ですのでわかりやすく教えて下さい。

仕事で、管理図を作成するにあたり、3σ法で管理限界線(UCL,LCL)を計算せよとの事を言われましたが、理解出来てません。

3σ法の公式とかあるんでしょうか?あったら教えて下さい。あと、3σとは何か、簡単に教えて下さい

Aベストアンサー

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため)
4)それを、(データの数-1)で割る(気持ちとしては、ばらつきの量を平均した感じ・データの数-1で割るのは、「母標準偏差の推定」という考え方があるから)
5) 3)でばらつきを2乗しているので、それをルートで開いて元に戻す

とうことになります。

統計上いくつかの前提があって、例えば、製造工程で普通にものを作った場合、いろいろなばらつきは、それぞれ独立に出ます。
そこで、結果的には、ある一定の平均値付近のものが多くでき、平均値から外れたものは、少しだけどできるという形になる場合が多いのです。
この場合、誤差が本当の意味での「ばらつき」であれば、これは、「正規分布」という分布(つまり、平均値付近が多く、それから離れると少なくなっていくような)をします。

この「正規分布に従う」という前提で、平均値±3σの間には、全体の、99%強 が含まれるというのが、統計的に知られています。
これを以て、3σで管理という事になります。


さて、「管理図」ということですが、いろいろな種類のものがあります。
そこで、普通は、UCL, LCL は、製品自体の規格値(か、それから算出された値)を使うので、直接、3σは出てこない気がするのですが。
考えられるのは、x-s (平均と、標準偏差の管理図)で、標準偏差に対する上限管理値が3σなのかなと。(この場合、下限の管理値はありません。0が理想なので)

まず、3σというのは、σの3倍のことです。
そして、σというのが、「標準偏差」といわれるもので、これはばらつきの大きさを表すものです。

計算方法などは、
http://www.mbanavi.com/school/stat04.htm
最近では、excel で計算してしまうという手もあります。(が、それでは意味がつかみにくいかも)
基本的には、
1)全体の平均をとる
2)個々のデータと平均との差を求める(この大小がばらつきに相当)
3) 2)でとった個々のデータについての差を2乗する(プラス・マイナスの影響をなくすため...続きを読む

Q3σについて教えてください(基本的なこと)

文系出身なので、基本的なことが分かっていませんが、仕事の資料で出てきたので教えてください。
3σとは標準偏差で、規格を外れる確率が99.7%? など、少し調べたのですが、まだまだ分かりません。

例)
取引先の製品の、あるパラメータ(寸法)のロット内ばらつきを示す資料に、N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021というものありました。
※数値はうろ覚えです・・・
質問)
AVE.は20個測定した平均が、5.983mmだったということはもちろん分かるのですが、3σの0.021とはどう理解すればよいのでしょうか。
6.00mmに対して、0.021mm以上ずれる確率が0.03%と思えばよいのでしょうか?それともAVE.に対して0.021mmずれる確率???
そもそも0.021の単位は?(mm?)
はてなばかりですみません。初歩的な質問ですみませんが、例を挙げて分かりやすく教えていただけたら幸いです。

Aベストアンサー

> N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021

を普通に読むと、規格6.0mm(±0.3mm) で 20 個製造して検査したところ、平均値は 5.983 で標準偏差は 0.007mm (=0.021÷3) であった、という意味になります。標準偏差の単位は、標準偏差は「平均からのずれ」の平均ですから、平均値と同じになります。

この工程での真の平均値をμとしますと、今回の 20 個製造して得られた平均値 X=5.983 の標準偏差は 0.00157 (=0.007/√20) 程になります。これは、μは 99.7 %の確率で 5.983±(3×0.00157) にあることを示しています。
ここから、真の平均μが 6mm であったならば 0.3% 以下しか起こらないような珍しいことが起こっているという意味で「統計的に有意な差がある」といい、真の平均は6mmではない、と結論づけることが出来ます。

それから、製品一つ一つについては、平均 5.983±0.021 に入らない確率は 0.03 %になります。
何れにせよ、99.7%は規格の範囲内に入っていることになりますね。

> N=20個 規格6.0mm±0.3mm AVE.5.983で、3σ0.021

を普通に読むと、規格6.0mm(±0.3mm) で 20 個製造して検査したところ、平均値は 5.983 で標準偏差は 0.007mm (=0.021÷3) であった、という意味になります。標準偏差の単位は、標準偏差は「平均からのずれ」の平均ですから、平均値と同じになります。

この工程での真の平均値をμとしますと、今回の 20 個製造して得られた平均値 X=5.983 の標準偏差は 0.00157 (=0.007/√20) 程になります。これは、μは 99.7 %の確率で 5.983±(3×0.00157) にあることを示...続きを読む

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む

QエクセルのグラフにX軸に水平な線を入れたい

初歩的な質問で申し訳ありません。

エクセルで折れ線グラフを作ったときにYが最大値の点とY軸を交差するX軸に水平な線を引くにはどうすればいいでしょうか。

最大値を人目で見えるようにしたいのです。

よろしくお願いいたします。

Aベストアンサー

再び 失礼 
では、
グラフAの最大点「17.0」
グラフBの最大点「19.2」
グラフCの最大点「15.5」
を、グラフのX軸分入力しあと3つグラフを作る(A’・B’・C’)
要するに 17.0の横線グラフ=水平線
または、面グラフにして 面の色は色なし、輪郭を「例えば赤」
そうすれば水平線(赤)が見える

Qエクセルで正規分布の作り方

色々紹介はされているとは思いますがいまいち作成方法がわかりませんので教えてください。
n=50で得点の正規分布図をエクセルで作成したいのですが具体的にどういう順番で処理すればよいでしょうか?よろしくお願いします。

Aベストアンサー

正規分布の曲線をプロットしたいのでしょうか?

エクセルの関数を使う方法はこちら
http://home.kanto-gakuin.ac.jp/~ahero/excel/func/norm_graph.shtml
曲線の方程式からプロットする方法はこちら
http://oshiete.goo.ne.jp/qa/853670.html

でも、平均値と標準偏差が解らないと描けないですね。
ご質問の意味が、得点と、頻度をプロットしたグラフという事なら、
単に、折れ線グラフだと思います。
具体的なデータ等補足していただかないと、的確な回答は付かないと存じます。

こんなサイトを見つけましたが、なかなか面白そうです。
http://homepage1.nifty.com/gfk/excel.htm
http://homepage1.nifty.com/gfk/average.htm

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q確率と平均値と標準偏差

教えてください。
確率で数値を出した場合に、その確率の値から標準偏差は出せますか?
barを挿入した場合に0%や100%を超える事になったりして、意味のある数値なのか気になりました。

で、標準偏差の値は平均値にそのまま足したり引いたりしたのが範囲となるのですよね?
標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?(つまり、こうすると標準偏差で出る値の半分が上限、下限となりますが)

Aベストアンサー

他の回答者の方々がおっしゃっているように、標準偏差はデータのばらつきを表すものです。
なんらかの計算をして確率を出しても、数値1個では標準偏差は出せません。
データが複数あって、平均や標準偏差が計算できます。

barはvarの誤りでしょうか。varは一般に分散を表現するキーワードですね。Excelを使っているのでしょうか?
varは(データ - データの平均値)の2乗の和をデータ数で割ったものなので、非常に大きく(データが小数点以下なら小さく)なります。

2乗のデータをそのまま足すことに意味はありません。
長さに面積を足すようなものです。
通常、varのルートを取ったものを平均に足します。
これで同じ次元のデータになります。
これが標準偏差の考え方です。

また、
      平均値±標準偏差(√分散)
はデータの最大値と最小値の範囲を指すものではありません。(通常、範囲といえば最大値と最小値の差になります)
"平均的な存在範囲"とでも表現するのが適切だと思います。

標準偏差で出た数字は範囲ですので
>標準偏差で出た数値の中心を平均値にもってくるのは間違いですよね?
という考えは合っています。
標準偏差という言葉で”平均値+標準偏差”や”平均値ー標準偏差”の値を使っている人やソフトウェアがあると、こういう風に思ってしまうのかもしれません。

(この説明では確率を単に割合として観測されたデータとして解釈しています。確率にはもっと違う意味がありますので、適当に使うと誤解を生みやすい表現になります。)


以上、確率や統計の世界に少しでも興味をもっていただけたらなぁ・・・と期待するharisenbonでした。

他の回答者の方々がおっしゃっているように、標準偏差はデータのばらつきを表すものです。
なんらかの計算をして確率を出しても、数値1個では標準偏差は出せません。
データが複数あって、平均や標準偏差が計算できます。

barはvarの誤りでしょうか。varは一般に分散を表現するキーワードですね。Excelを使っているのでしょうか?
varは(データ - データの平均値)の2乗の和をデータ数で割ったものなので、非常に大きく(データが小数点以下なら小さく)なります。

2乗のデータをそのまま足すことに...続きを読む

Qエクセルの散布図のX軸に文字を表示したいのですが、どうしたらよいのでしょうか?

エクセルの散布図を使って、下の表をグラフにしたいと思ってます。
a  a1
b  a2
c  a3

この場合、そのまま折れ線グラフにすると、X軸にしっかり、a,b,cと出てくるのですが、散布図の場合は、X軸が1,2,3となってしまって、セル内の文字が表示されません。

X軸の目盛りに、セル内の文字を表示させるにはどうしたらよいのでしょうか?お願いいたします。

Aベストアンサー

残念ですが散布図では不可能です。
そもそもグラフの概念が違います。
散布図は変数領域に対するもう一方の変数の領域を見るためのグラフです。
主に物の寸法バラツキに対する、出力される数値などの相関性を見るために使用するので、要素は全て変数なんです。

質問内容のグラフは、モノに対する物量をあらわすという考え方がありますので、X軸は必然的に固有名詞になります。
この場合、散布図ではなく折れ線グラフで表すのが普通ですね。(2軸の折線でなくても可能)
Y軸要素が2つまでなら、Y1軸とY2軸に分けて要素振り分けが可能です。3つ以上ですと、EXCELでは不可能でしょう。
また、X軸の名称は同列の高い順に並びますので、連続性がある場合は、グラフの元データは上から順番に記入していかなくてはなりません。

Q前年比の%の計算式を教えてください

例えば前年比115%とかよくいいますよね?

その計算の仕方が分かりません・・・
例えば 前年度の売り上げ2.301.452円
    今年度の売り上げ2.756.553円
の場合前年比何%アップになるのでしょうか?計算式とその答えを
解りやすく教えて下さい・・・
バカな質問でゴメンなさい(><)

よろしくお願いします。

Aベストアンサー

 
(今年の売上÷前年の売上×100)-100=19.8%の売上増加

 


人気Q&Aランキング