Excel2000でのT検定について　統計

Question

分析ツールにて一対の標本による平均の検定をおこなっておりますが、納得がいく結果が得られないのでこまっております。
詳細には
ｎ＝２で危険率5％でｔ検定。
その差が１０のものはｔ＝２３.４、ｔ境界値両側が１２．７ということで有意差が認められました。
しかし同じように他のものでその差が１４もあるものをｔ検定したところ、ｔ＝８．４、ｔ境界値両側が１２．７で有意差が認められませんでした。私としましては、その差が大きいものの方が当然有意差があって当たり前だと認識しておりましたが、その差が小さい方が有意差ありと認められ、その差が大きいほうが有意差はないと言う結果がでてしまい、納得がいきません。どなたか、統計とうお詳しい方、教えてください。

zinchan · Accepted Answer

Ｔ検定でなく、ｔ検定という記述にしましょう。

回答
　それぞれの平均値、分散値が不明で、何とも判断のしようがありません。(なお、この２つの値は、ｔ検定の基礎となる数値ですから、どんな場合でも必ず明記しましょう。)
　恐らく、平均値では最初のものの方が差が小さいが、分散値も極めて小さいので、有意差が出た。
　次のものは、先程のものに比べ平均値の差が大きいものの、分散値が大変大きいので、信頼域が広くなり、有意とは言えなかった。
　以上により、ご質問のような結果となったのではないかと推察します。
　ご質問からして、同じような検定を２回行っているところからすると、同じような調査(実験)をそれぞれ行っているにもかかわらず、一方では有意、もう一方では差が認められないということは、サンプル数が少ないか、データの抽出方法に問題があった(無作為抽出でない、たまたま偶然に偏ったデータを抽出した)可能性があります。

確認事項
　ｎ＝２は、サンプル数として少なすぎませんか。正規性のあるデータであるかどうかも疑わしくなってしまいます。たまたま有意差の大きいサンプルをとっただけかもしれず、信頼性に疑問があります。私には何のデータかはわかりませんし、知る必要もありませんが、もし、研究発表等でそのような検定結果を発表されていたら、私がその場に居合わせたならば、絶対に信頼性についての疑問点を質問してます。
　各群のサンプルデータが２つ以上(但し同値は含めず)あれば、計算上は検定できますが、平均値、分散値がどの程度信頼性がおけるのかを検討せねばなりません。その値が十分信頼に足るものであればいいのですが、仮に再度データを抽出したときに異なっているようなら、信頼性はありませんので、検定自体が無意味です。
　なお、ｔ検定を行うに必要なサンプル数は、だいたい以下の式で大まかに見積もることができます。これだけ集めれば、5％有意水準で有意差がでる可能性が高いといってもいいかもしれません。仮に、ここで出てきたｎが抽出しきれないほど極めて大きければ、逆にそれだけ集めないと有意差がでてこないということで、有意な差があるとは言い切れないといえるかもしれません。
　ｎ≒6.182682×(２×分散値)/(（標本2平均値-標本1平均値)^2)：片側検定
　ｎ≒2.769062×(２×分散値)/(（標本2平均値-標本1平均値)^2)：両側検定
　※ともに第１種過誤率=0.05、第２種過誤率=0.2の場合

　ｔ検定をするにあたり、まず、等分散性の検定(Ｆ検定)を行い、有意差が認められないことを確認して後、１対の・・・ｔ検定か、等分散を仮定したｔ検定に進みます。
　Ｆ検定で有意差が認められたら、分散が等しくないと仮定したｔ検定(Welchの方法)で検定します。

　等分散性を仮定できるｔ検定では、行ってみた１対の標本による平均の検定(対応のあるｔ検定)と、その他のｔ検定(対応のないｔ検定)に大きく分けられます。
　ここでの標本１と、標本２の各データは、同じ条件下に設定されたブロック因子間（例えば、Ａさんの使用前・使用後など、比較する群の各データが、１：１で対応するような関係のデータ）での比較であれば、行ってみた検定方法でけっこうですが、ブロック因子を設定しておらず、サンプルをアトランダムにとりだしたもの（比較したいグループの各データが、もう一方のグループの各データに１：１の対応が見られず、抽出したデータの並びをランダムに変えて並び替えても支障がないようなデータ、無作為に抽出したデータの比較）であれば、対応のないｔ検定(等分散を仮定したｔ検定)を選択します。貴方のデータが、どれに該当するか検証して、適した検定方法を選択してください。

　蛇足ですが、この場合、ノンパラメトリック検定ではサンプルデータ数が少ないため、有意差を出すことが不可能ですので、ノンパラ検定を考える必要はありません。

　余談ですが、エクセルの統計についての結果は信頼性に欠けるという話は昔からいわれております(下記URL参照)。
　今回については、これには該当せず、また、計算としては誤差等の影響はないと思われますので、その点についてはご心配なされる必要はありません。

参考URL：http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/index.html

zinchan · Answer

＃１補足欄の質問事項について
　そうです。「^２」は、二乗の意です。Ａ×Ａ＝Ａ^2です。
　サイトでは右肩上がりの小さい２(二乗）を表示できないので、このように表現しました。
　エクセルで、「＝10^2」と入力すると、100と表示されます。
　マメ知識ですが、「＾」は、「ハット」と読みます。私もこの間までヤマとかヤマギリとか言っていました。他の人も、意味は分かってくれていましたが(脱線)。

　分散値はどっちを採るかと言うことについては、対照区、もしくは標準に相当する方でいいです。
　
＃2お礼の欄の質問事項について
　もし、あなたが、明らかに測定ミスのデータと確信しているのに、それを含めて検定しようと思いますか。また、病気でホルモン分泌が少ないと分かっている検体を、他の正常な検体とともに測定し、検定しようと思いますか。

　データを取って、外れ値と思われる値の原因を探らず、もしくは外れ値をはずしてもいいかを検討もせずに、除外して検定するのは不適切です。重要な情報を捨てているかもしれません。
　また、作為的にデータを拾い出して検定する行為はいけません。改ざんです。
　この場合は、検体が他と同一でなく明らかに(恐らく？)異質のデータとなるものや、測定ミスと思われるという点で、これらが推測にしろ、指示者の長年の経験から原因追及と検討を行っていると解釈してもよろしいかと思います。
　厳密に言えば、外れ値の検定を行い、結果をさらに検討せねばなりません。それは不足していたと思います。
　さらに、作為的にデータを拾い出した行為にあたるかどうかが論点になると思いますが、データを拾い出したのか、ノイズを除去したのかは外れ値の検定を行ってない以上、分かりません。
　ただ、ノイズ(異質データ)により結果が攪乱されることを防ぐことは必要かと思います。
　操作は作為的だったかもしれませんが、結果的に異質なデータを除いたと解釈してあげても良いのではないかと思います。
　
　また、検体数が約100頭前後でしたら、サンプル数としては十分なデータ数だと思います。
　動物の場合、場所を取る上、同一条件の検体を揃えることがかなり困難になりますね。測定も時間がかかり、最初の測定と最後の測定に誤差が入り込んでしまうかもしれません。指示者はそこまでのリスクを考えていらしたのでしょうかね。
　よほど微妙な差で、有意差を出したかったのでしょうか。
　完全無作為抽出をしていれば、少ない検体でも差を見いだすことは可能です。検体数を多くしたからと言って、精度の高い検定とはいえません。
　約100頭もいれば、そのうちの２頭を、完全に無作為に抽出して除いても、大勢に影響は出ないものと思われます。
　しかし、その２頭を含めると有意でないものが、２頭を除外したら有意というのであれば、たくさんの頭数から考えると、微妙です。計算では有意でも、実質的には有意とは言えなかったのかもしれません。やはり外れ値かどうか検定して検討するべきでしたね。
　結論として、理論的には問題があり、再検討を要すると考えますが、指示者がデータを一つ一つはずして検定して有意差が出るものを選抜していたならともかく、データを一目見て、２つのデータをはずしてと指示したのでしたら、その方のの経験に敬意を表して、目をつぶってやっても構わないのではないですかね。研究発表会等で、実際の効果の有無について問題がありそうなら、ケンケンガクガク検討されていたことでしょう。

zinchan · Answer

早速のご挨拶、恐れ入ります。

　さて、お礼の項３～４行目のことについて、一言申し上げたく、再度おじゃまします。

　抽出したデータを、何の原因解明もせず、また、数学(統計)的な検討も行わず、棄却してしまってはいけません。
　十分精査して、なぜ外れ値が生じたのかをひもといてみなければいけません。
　例えば、抽出条件や環境条件が異なっていたとか、余計な反応をさせてしまったとか、もしくは複数の異なる母集団からとったものかもしれないですし、記載間違いであるかもしれません。
　それらを検討して、原因を探ってください。原因が判明すれば訂正できるものは訂正して、そうでなければさらにスミルノフ・グラブス検定で外れ値を棄却してよいものかを検定し、なるべく慎重的に棄却してください。
　それらを検討せず、都合の悪そうなデータを棄却してしまうくらいなら、再抽出して新たにデータを揃えるようにして下さい。
　再度そういうことが見られるようであれば、場合によっては、その外れ値は何か意味があり、とんでもない発見になるかもしれないのです。

　あと、同条件と仮定できる場合において抽出されたデータを分けて検定するのは意味がありませんし、いけません。
　例えば、正規分布している１つの集団において、それを平均より高いものと低いものに分けて検定する意味がありますか。もしくはデータの外れ値と、そうでないものとを比較することに意味がありますか。検定すれば有意差が出ますが、その有意差に何の意味があるのでしょう。
　具体的に例えば、全く同じ環境条件で大根を栽培したとき、肥料の多少による２つの群の収量の差を検定することは意味がありますが、大根の特に大きいもの２本と、その他の大根を比べることで、何が得られるのでしょう。大きい大根は他の大根に比べて有意に大きかったか否かと言うだけで、そこから肥料の多少による効果を判断することができないのと同じ事です。

　なお、当初抽出したデータに、改めて新たに抽出したデータを加えて(合算して)検定しては行けません。
　なぜなら、当初抽出したときと、改めて抽出したときでは、たとえまったく同じ条件に設定したつもりであったとしても経時的には別の試験であり、細かく言えば、改めて行った抽出法は、まったく同じ条件を保っているとは言い切れません。たとえ話が同じでは芸がないので、魚の成育調査で例えると、人工環境施設で、前回と同じ条件による餌条件、水温で成育したつもりでも、餌の質まで全く同じか、水温の分布範囲が前回と全く同じかとは言い切れないでしょう。
　いっときに多数揃えて同時に調査すれば、それらの条件は全く同じと言っても良いですが、時期を変えての調査はあくまでも別の試験として捉えねばなりません。

　実験や調査では、事前にサンプル数の確保目標数や、検定法をあらかじめ決めておき、それから実験・調査に移り、必要なサンプル数がとれてから、当初の検定法で検定し、有意差を見、十分な検討を行った後に効果を判定し、結論を得る流れで行います。
　統計の検定法は、極めて多数のデータを集めれば、有意差がだんだん出やすくなってしまうため、有意差が出るまでデータを集めるとかも、ルール違反です。
　よって、通常は予備実験(調査)を行って後、必要サンプルを集め、本実験(調査)に入り、データを得、検定するというようにしなければ、信頼に足る結論を導き出すことができません。
　検定とは、実験(調査)前から検討して始めておかねばならないものです。

　あと、何かを抽出するときに最も大事で、大変なことがあります。
　それは、無作為(ランダム)に抽出(設定)するということです。つまり、母集団からむらなく抽出することが、全ての実験・調査、全ての検定法における大前提です。これができてないと、実験・調査自体が無意味なものになります。
　実験における無作為配置や乱塊法・調査地点のランダム抽出、世論調査の２段階層別抽出など、信頼性を高めるための最適な手段を選択して、抽出するよう心がけていただけますことをお願いいたします。
　頑張ってください。

Excel2000でのT検定について 統計

Ｔ検定でなく、ｔ検定という記述にしましょう。

この回答への補足

＃１補足欄の質問事項について

早速のご挨拶、恐れ入ります。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

Excel2000でのT検定について　統計

　Ｔ検定でなく、ｔ検定という記述にしましょう。

　早速のご挨拶、恐れ入ります。