人に聞けない痔の悩み、これでスッキリ >>

はじめまして ななみと申します。初めて質問さていただきますので、なにかとわかりにくいところがあるかと思いますが、どうかよろしくご指導お願いします。 A1:210、B1:135、C1:113、D1:127 / A2:31 B2:30 C2:29 D:26 というデータがあって、Aについて見たときにA1がBCD1と比べた場合、突出しているとおもうんですが、A2に関してはBCD2と比べると確かに四つの中では最も高い数値を示していますが注目するほど突出しているように思えません。私のレポートの比較に使いたい項目はA25ぐらいまであり その中からAが突出しているものがどれかを選びたいのです。 A10、A14が突出して高く A4、A19が突出して低い といった風にです。
エクセルを使ってAが突出しているか、していないかを判定する方法をアドバイスしていただけませんでしょうか。
「5%で有意である」とゆうふうにすればいいのかなと思ったりしたのですが、エクセルのT検定というところのヘルプをみたり、統計学のHPをみたりしたのですが理解ができず、とりあえずあさってのレポートの為になんとか方法だけでもと思って質問させていただきました。よろしくお願いいたします。

このQ&Aに関連する最新のQ&A

A 回答 (2件)

>>突出している




とは、異常値の検定でしょうか。(データがどのように取
られ、何をしたいのか、少々不明ですが...)

異常値の検定(測定データ中に、他のデータに比べて異常
な値が有った場合、そのデータは測定ミスとして棄却すべ
きかどうかを検定する)は、母集団が正規分布をしている
ときに、異常値がその範囲を超えているかどうかを検定し
ます。

計算式は簡単で、

    [データ値(Xn)] - [標本平均(μ)]
Tn = ────────────────
       標本標準偏差(σ)

を計算し、スミルノフ・グラッブス検定の有意点α(片側)
の表の値と比べます。(ちなみに、T【A1:210】は、1.4668
で、n=4, α=0.05 (5% 優位水準)の、1.462 より大きいの
で、異常値です。)


棄却検定
http://web.enshu-net.or.jp/w3/kobayashi/rejectio …
 2.Smirnov-Gravus(スミルノフ・グラッブス検定)の棄却検定


統計学入門
http://www.tekipaki.jp/~rootzx/html/Statistics.h …
└→ 異常値の検定(グラブス・スミルノフ棄却検定)
   http://www.tekipaki.jp/~rootzx/html/Statistics60 …

参考URL:http://web.enshu-net.or.jp/w3/kobayashi/rejection.htm,http://www.tekipaki.jp/~rootzx/html/Statistics60 …

この回答への補足

Zz_zZさん 早速 お返事くださって有難うございます。
とてもわかりやすいアドバイスで、1.4668もすぐに自分で導いてくることができました。私のデータに当てはめて試したところ、いくつかの異常値を得ることが出来ました。ありがとうございました。
ただそこで、一つ質問あります。異常に多い場合はわかったのですが、異常に少ない場合はどうすればよろしいでしょうか? 
教えていただいたHPにあるThompsonの棄却検定法 を使えば小さいものを検定できそうだったのですが こちらのほうがいいでしょうか?
                          ななみ

補足日時:2002/11/05 16:08
    • good
    • 1

>>異常に少ない場合



標本平均より、「異常に少ない場合」(平均より異常に低
い場合)は、同様の計算で、Tの値がマイナスになります
ので、絶対値で比較してください。
    • good
    • 0
この回答へのお礼

お礼が遅くなり失礼致しました。Zz_zZさんのアドバイスのとおりにして無事レポートのほう提出し、OKをいただきました。
本当にお世話になりました、感謝しています。ありがとうございました♪

お礼日時:2002/11/07 13:20

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

QExcelを使ったはずれ値の検定

今、大学の卒論で水平方向でクロロフィル濃度を調べているものです。
私が計測したデータを処理するに当たって、私の主観ではなく根拠のある処理方法にのっとってはずれ値を抽出したいと考えています。
自力で色々と調べた結果、グラブス・スミルノフ検定を用いるのがよいと思ったのですが、Excelの中にはそれに対応した関数がありません。

外部のアドインソフトを用いれば可能なのですが購入するお金もなく困っております。

どなたかよい方法をご存知の方はぜひ教えていただきたいと思います。

※基本的にクロロフィル濃度のみではずれ値を出したいため、二軸のグラフなどは使用することができません。

Aベストアンサー

エクセルの関数に、グラブス・スミルノフ検定がずばり無いだけで、この検定に使う要素はエクセル統計関数にあるAVEDEVやSTDEV・・以下の関数が使えるのではないですか。
一度エクセルの統計関数の名前と機能簡単解説一覧をWEBから打ち出し、どれを使うか考えたら。
ーー
また
ユーザー関数という仕組み(VBA)があるので、順次段階的にそれらの関数を利用してできる(IFで場合分けも出来るが)ものなら、単独関数をまとめた関数を定義できますよ。
VBAの入り口ぐらいは勉強が必要だが。
ーーー
Googleで「グラブス・スミルノフ検定」で照会するのはやってみましたか。
http://software.ssri.co.jp/statweb2/sample/example_17.html
のようなものもあるようだ。

Q棄却検定方法について

データ数が6個くらいで異常値を棄却したいときにはどのような棄却検定方法があるのでしょうか?
例えば,3,4,2,10,3,4というデータのとき10を棄却したい場合の方法を教えてください。

Aベストアンサー

Grubs検定というのがあります。

参考URL:http://www.miyakonojo-nct.ac.jp/~a/staff/sharada/statistics.pdf

Qスミルノフ・グラブス検定の有意点算出方法

現在、あるデータの棄却検定を行っております。スミルノフ・グラブス検定の有意点の算出方法について、教えてください。
有意点の式が、
http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs-table.html
に載っていることはこのサイトで知りました。
この式の中の”tα/n”とは何を表すのでしょうか。エクセルで入力する場合、TINV(α*2/n,n-2)という内容になるようなのですが、これとの関係性を教えていただきたいです。
基本的なことで申し訳ありません。

Aベストアンサー

そのサイトに
>tα / n を自由度 n - 2 の t 分布の上側 100α / n% 点としたとき,
ていう定義がちゃんと書いてありますよ。

>TINV(α*2/n,n-2)
ExcelのTINV関数は両側%点を返します。
今は、上側%点を知りたいんで、α*2/nと、知りたい値(α/n)を2倍してあります。

QExcelでスミルノフ・グラッブス検定の有意点を求める方法

現在、統計作業でスミルノフの棄却検定を使って外れ値の可能性のあるデータの除外作業を行なっております。

で、
http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs.html

http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs-table.html
を参考に棄却可能か棄却不可かどうかを算出するExcelシートは用意できたのですが、標本の数が例えば792といったスミルノフ・グラッブス検定の有意点の表にはない標本数においてのスミルノフ・グラッブス検定の有意点tの求め方がうまくわからないところです。

どなたか教えていただけないでしょうか?
よろしくお願いいたします。

Aベストアンサー

よく分からないけど、
A1セルに n 、B1セルに α を入力して、

有意点 t =(A1-1)*TINV(B1*2/A1,A1-2)/SQRT(A1*(A1-2)+A1*TINV(B1*2/A1,A1-2)^2)

これで算出できるかも。

Qエクセル STDEVとSTDEVPの違い

エクセルの統計関数で標準偏差を求める時、STDEVとSTDEVPがあります。両者の違いが良くわかりません。
宜しかったら、恐縮ですが、以下の具体例で、『噛み砕いて』教えて下さい。
(例)
セルA1~A13に1~13の数字を入力、平均値=7、STDEVでは3.89444、STDEVPでは3.741657となります。
また、平均値7と各数字の差を取り、それを2乗し、総和を取る(182)、これをデータの個数13で割る(14)、この平方根を取ると3.741657となります。
では、STDEVとSTDEVPの違いは何なのでしょうか?統計のことは疎く、お手数ですが、サルにもわかるようご教授頂きたく、お願い致します。

Aベストアンサー

データが母集団そのものからとったか、標本データかで違います。また母集団そのものだったとしても(例えばクラス全員というような)、その背景にさらならる母集団(例えば学年全体)を想定して比較するような時もありますので、その場合は標本となります。
で標本データの時はSTDEVを使って、母集団の時はSTDEVPをつかうことになります。
公式の違いは分母がn-1(STDEV)かn(STDEVP)かの違いしかありません。まぁ感覚的に理解するなら、分母がn-1になるということはそれだけ結果が大きくなるわけで、つまりそれだけのりしろを多くもって推測に当たるというようなことになります。
AとBの違いがあるかないかという推測をする時、通常は標本同士の検証になるわけですので、偏差を余裕をもってわざとちょっと大きめに見るということで、それだけ確証の度合いを上げるというわけです。

Qスミルノフの棄却検定法について

 スミルノフの棄却検定法について勉強しています。
 私の持っている資料では5%の危険率における棄却検定図は載っているのですが、曲線の関係式や棄却検定表が載っていないので、自分で具体的にTNを求めることができません。
 インターネット等で曲線の式や、あるいは検定表が入手できるのであれば、どなたか教えて下さい。

Aベストアンサー

↓こちらの「5. 統計数値表から有意点tを求める。」のリンク先をご覧下さい。

http://aoki2.si.gunma-u.ac.jp/lecture/Grubbs/Grubbs.html

Qデータが正規分布しているか判断するには???

初歩的なことですが。。急いでいます。
おわかりになる方 教えてください。
サンプリングしたデータが正規分布しているかどうかを確認するにはどうすればよろしいでしょうか。
素人でも分かるように説明したいのですが。。
定性的にはヒストグラムを作り視覚的に訴える方法があると思います。今回は定量的に判断する方法を知りたいです。宜しくお願いします。

Aベストアンサー

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区間距離、度数区分数は、正規的なグラフになるように試行錯誤で行うことが多い(区間距離や度数区分数を本来の分布に則するようにいろいろ当てはめて解釈する。データ個数の不足や、データの取り方、または見かけ上の分布によりデータのばらつきが正しく反映されて見えないことがあるため)のですが、度数区分数は、機械的に、
=ROUNDUP(1+LOG10(データ個数)/LOG10(2),0):エクセル計算式
で区分数を求める方法があります。
 また、区間距離は、=ROUND((データの最高値-最低値)/(度数区分数値-1),有効桁数)で求め、区分の左端は、
=ROUNDUP(データの最低値-区間距離/2,有効桁数)
右端は=ROUNDUP(データの最高値+区間距離/2,有効桁数)
とします。
 区間がと度数区分数が出たら、その範囲にあるデータ数を数えて、ヒストグラムができます。
 
>最小側、最大側は 最小値、最大値を含んだ値としなければならないのでしょうか。
 ヒストグラム作成の処理に関しては、上記を参考にしてください。
 その前に、データの最小値と最大値が、正しくとれたデータか検討するため、棄却検定で外れ値が存在するか否かを検定し、外れ値が存在しないと結論づけられたら、正規分布の検定を行ってみてください。もし外れ値が存在する可能性があれば、そもそも、そのデータの信頼性が失われます。サンプリング手法の再検討(データの取り方に偏りがなかったか、無作為に設定してデータを取っていたか等)をして、再度データを得る必要があります。また、そもそも検定する以前に、データ数が少ないと判断が付かなくなってしまいますので、データ数は十分揃える(少なくとも20~30個)必要もあります。

>機械的に処理してみるとできました。
>でも理屈を理解できていません。
 とりあえず、理屈は後で勉強するとして、有意水準5%で有意差あり(有意確率が0.05以下)であれば、正規分布ではないと結論づけてお終いでいいのではないですか。
>この検定をもっと初心者でもわかりやすく解説しているサイト等ご存じありませんか。
 私が知っている限りでは、紹介したURLのサイトが最も丁寧でわかりやすいサイトでした。
>データの区間を分けるときのルール等ありますでしょうか。
 ヒストグラムを作成する場合、区...続きを読む

Q相関係数についてくるP値とは何ですか?

相関係数についてくるP値の意味がわかりません。

r=0.90 (P<0.001)

P=0.05で相関がない

という表現は何を意味しているのでしょうか?
またMS Excelを使ってのP値の計算方法を教えてください。

よろしくお願い致します。

Aベストアンサー

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場合はp=0.1%でもいいと思いますが)
相関係数においても相関の有無を結論つけるにはそのrが偶然出る確率を出すか、5%の確率ならrがどれぐらいの値が出るかを知っておく必要が有ります。

>r=0.90 (P<0.001)

相関係数は0.90と計算された。相関がないのに偶然r=0.90 となる確率は0.001以下だと言ってます。

>P=0.05で相関がない

相関がないと結論。(間違っている確率は5%以下)だと言ってます。

エクセルでの計算ですが、まず関数CORRELを使ってr値を出します。xデータがA1からA10に、yデータがB1からB10に入っているとして

r=CORREL(A1:A10,B1:B10)

次にそのr値をt値に変換します。

t=r*(n-2)^0.5/(1-r^2)^0.5

ここでnは組みデータの数です。((x1,y1),(x2,y2),・・・(xn,yn))
最後に関数TDISTで確率に変換します。両側です。

p=TDIST(t値,n-2,2)

もっと簡単な方法があるかも知れませんが、私ならこう計算します。(アドインの分析ツールを使う以外は)

pは確率(probability)のpです。全く相関のない数字を組み合わせたときにそのr値が出る確率をあらわしています。

統計・確率には100%言い切れることはまずありません。というか100%言い切れるのなら統計・確率を使う必要は有りません。
例えばサイコロを5回振って全て同じ目が出る確率は0.08%です。そんな時、そのサイコロを不良品(イカサマ?)と結論つけるとわずかに間違っている可能性が残っています。ただ、それが5%以下ならp=0.05でそのサイコロは正常ではないと結論付けます。
それが危険率です。(この場...続きを読む

QExcelの近似曲線で外れ値(異常値)を除外したい

Excelの近似曲線についての質問です。実験データーを基にしたある散布図についての近似曲線を作りたいのですが、散布図の点の中に明らかに近似曲線に用いるのに不適な外れ値(異常値)があります。このような外れ値(異常値)を除外して他の値のみを用いた近似曲線を作る方法があれば教えてください。よろしくお願いします!

Aベストアンサー

>外れ値(異常値)を除外して
外れ値を別のデータ系列にして、他の値のみの系列を用いた近似曲線を描く
散布図のプロットの色を2つの系列とも同じにする。

Qエクセルで計算すると2.43E-19などと表示される。Eとは何ですか?

よろしくお願いします。
エクセルの回帰分析をすると有意水準で2.43E-19などと表示されますが
Eとは何でしょうか?

また、回帰分析の数字の意味が良く分からないのですが、
皆さんは独学されましたか?それとも講座などをうけたのでしょうか?

回帰分析でR2(決定係数)しかみていないのですが
どうすれば回帰分析が分かるようになるのでしょうか?
本を読んだのですがいまいち難しくて分かりません。
教えてください。
よろしくお願いします。

Aベストアンサー

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるための指数表記のことですよ。
・よって、『2.43E-19』とは?
 2.43×1/(10の19乗)で、
 2.43×1/10000000000000000000となり、
 2.43×0.0000000000000000001だから、
 0.000000000000000000243という数値を意味します。

補足:
・E+数値は 10、100、1000 という大きい数を表します。
・E-数値は 0.1、0.01、0.001 という小さい数を表します。
・数学では『2.43×10』の次に、小さい数字で上に『19』と表示します。→http://ja.wikipedia.org/wiki/%E6%8C%87%E6%95%B0%E8%A1%A8%E8%A8%98
・最後に『回帰分析』とは何?下の『参考URL』をどうぞ。→『数学』カテゴリで質問してみては?

参考URL:http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90

★回答
・最初に『回帰分析』をここで説明するのは少し大変なので『E』のみ説明します。
・回答者 No.1 ~ No.3 さんと同じく『指数表記』の『Exponent』ですよ。
・『指数』って分かりますか?
・10→1.0E+1(1.0×10の1乗)→×10倍
・100→1.0E+2(1.0×10の2乗)→×100倍
・1000→1.0E+3(1.0×10の3乗)→×1000倍
・0.1→1.0E-1(1.0×1/10の1乗)→×1/10倍→÷10
・0.01→1.0E-2(1.0×1/10の2乗)→×1/100倍→÷100
・0.001→1.0E-3(1.0×1/10の3乗)→×1/1000倍→÷1000
・になります。ようするに 10 を n 乗すると元の数字になるた...続きを読む


人気Q&Aランキング