アプリ版:「スタンプのみでお礼する」機能のリリースについて

一般に統計的検定は、母集団に関する仮説を標本から得た情報に基づき検証することだと思います。しかし、t検定の例題で、『学校の1組と2組の各クラスの数学テストの平均点を比較して有意な差ががあるかどうか検証しよう』というものがあります。この例題では、1組と2組自体がすでに母集団であるため、各クラスの平均が母平均となり、検定するまでもないように思います。母集団の母平均が分かった訳ですから、この母平均を単純に比較すればいいのではないでしょうか。
どのように考えればよいか、アドバイスをいただけますと助かります。
宜しくお願い致します。

A 回答 (4件)

#3です。



とは言っても、おっしゃる通り「何度も試験を受けさせることは不可能」であることは理解します。

全員の得点が分かっていれば、
・マン・ホイットニーのU検定(サンプルサイズ<20の場合)
・2標本のコルモゴロフ・スミルノフ検定(サンプルサイズが大きい場合)
のようなノンパラ検定を使ったらいかがでしょうか。

ご質問である代表値の比較ではなくなりますが・・・。
    • good
    • 0
この回答へのお礼

詳細なご回答ありがとうございます。色々な検定があるのですね。勉強していきたいと思います。ありがとうございました。

お礼日時:2022/02/13 20:24

>例えば、1組平均80点 2組平均78点 だった場合は、1組ができると結論付けていいでしょうか。



結論付けることは全く不可能です。

理由は2つあり、

①たとえサンプルでなくても、平均値は頑健ではありません。たまたま体調が悪かった子がいて、平均値を引っ張っているかもしれません。頑健な推定量であるトリム平均や中央値を比較すべきです。
そうであっても、1回の観測から結論付けることは不確実性が高いです。

②サンプルの場合、平均値は偶然誤差を伴います。その大きさはσ/√nです。σは母集団の標準偏差(あるいはその推定値(サンプルの不偏分散の平方根))、nはサンプルサイズです。(クラスの人数が等しくない時は誤差全体の推定式が少々面倒になります。それはサンプルサイズ不揃いのときの平均値の差の検定を見れば分かります)
この偶然誤差を上回る差があれば、有意な差とみなすことはできます。これがu検定、t検定です。

ただし、サンプルサイズnが大きくなると、平均値の偶然誤差はどんどん小さくなり、些細な差でも有意になってしまいます。近年、②のような議論をするのは統計的に間違いとされています。(その代わりにベイジアン分散分析を用います)


>どのように考えればよいか、アドバイスをいただけますと助かります。

たとえば、ある組の方が平均値が大きいことが連続9回続いたら、「差あり」とみなすことができます。そんなことが偶然起きるとは考えられないということです。

これは、工業の世界の管理図と同じで、CL(センターライン)の片側に連続して9点プロットされると工程異常とする、ということはJISに書かれており、その元となったISOに統計的な証明が出ています。

その証明はちょっと面倒だったような気がしますが、勝ち負けが単純に1/2の確率なら、連続9勝って、(1/2)^9=1/512=0.00195 でおおかた正規分布の片側3σくらいの確率ですよね。こう書けば納得してもらえると思います。

以上述べたように、1回の試験の平均値を比較して何か言うことは、ほぼ無意味なのです。
    • good
    • 0

#1です。



補足です。

1組2組の比較を行うときは、その学年全体を大きな母集団と考え、1組2組は同じ母集団から得られたサンプルかどうかを議論するのですが、その証拠として、1組2組は「共通の分散」を持つと仮定しています。


テキストには、まず等分散の検定を行い、分散が異なるのであれば、ウェルチの検定を行いなさい、とか解説されていると思います。(古いテキストの場合)

ですが、厳密に等分散を立証するにはテキストにあるようなF検定ではダメで、同等性の検定と言う難しい手順を踏む必要があります。
そのため、近年はつべこべ言わず最初からウェルチの検定を行うのが定石になっています。

例えば、統計ソフトRのt検定は、有無を言わさずウェルチの検定が行われます。

ご参考まで。
    • good
    • 1
この回答へのお礼

早速のご回答ありがとうございます。助かりました。統計学も考え方進化しているのですね。
一つ確認させてください。1組と2組を母集団と考えて、どちらのクラスが数学ができるかを知りたい場合もあるかと思います。このとき、単純に平均を比べて結論をだせばいいのでしょうか。例えば、1組平均80点 2組平均78点 だった場合は、1組ができると結論付けていいでしょうか。もちろん、この場合は、何点差あれば優劣があると判断するのは統計的というより個人の感覚になると思いますが。
また、真の優劣を判断するには、1回のテストでは不十分で、何回も1組と2組にテストを受けさせる必要がある。しかし何回もテスト受けさせることは困難。そこで、そのうち1回の平均的の差から、真の優劣がどれくらいの確率で起こるかを検証する。この考え方は、おかしいのでしょうか。
お礼の中で再度質問となり、恐縮ですが宜しくお願い致します。

お礼日時:2022/02/13 09:56

そのとおりですね。



『学校の1組と2組の各クラスの数学テストの平均点を比較して有意な差ががあるかどうか検証しよう』という問題設定が悪いです。

本来は、
その学年全体を大きな母集団と考え、『1組2組のうち、1組にだけ新しい学習方法を取り入れた。その学習方法の効果があったと言えるか検定せよ。』
という、要因効果の検証を行うのが検定です。

1組を介入群、2組を対照群(コントロール)といいます。

系統的な差が何も無いのに差を検定せよ、ということ自体が無意味です。
平均値の比較すら無意味です。
    • good
    • 1

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!