
確率統計における検定についてお尋ねします。
ある本には、2つの標本があって、その2つが同一母集団から抽出されたと言っていいかどうかを調べる。これが検定である、と書いてありました。
一方で仮説検定ということになると、検定の前に仮説が提示され、その仮説が成立するかどうかを検定するということになると思います。
この2つの"検定"に対する説明は微妙に違うようにも思えます。前者は仮説が明確に提示されていないからです(暗黙的には提示されている)。
検定とは、
1.仮説を提示する。(明確に提示されていないなら明確化する)
2.その仮説が満たすべき条件を設定する。棄却域・採択域とか。
3.その標本が2を満たしているかどうかチェックして判定する。
ということでいいでしょうか。
定期試験の合否なら、
1.この学生はこの科目を習得している
2.試験で60点以上の得点がある。棄却・採択の閾値が60点
3.試験を採点する。
確率統計はいろんなものを対象にしているので本の書きぶりに幅があって、かつかなり暗記的な部分(60点とか95%とか、対象とそれが従うべき分布とか)もあり、腰が定まらない感じがします。
どのようなものを相手にしてもこのような解釈が成り立つでしょうか。
よろしくお願いします。
A 回答 (24件中21~24件)
- 最新から表示
- 回答順に表示
No.4
- 回答日時:
#3です。
>この2つの"検定"に対する説明は微妙に違うようにも思えます。
ご質問者様は初学者とお見受けしましたが、Fisher の有意性検定とNeyman–Pearson の仮説検定の違いを感じ取るなんて、すごい感性の持ち主だと思いました。
素晴らしい!
私なんか、最初のうちは何度説明を受けても理解できませんでした。
回答ありがとうございます。私は何もわかっておりません。ただ、自然に疑問が出てきただけです。理解できないのでどうなっているの?というわけです。
確率統計は難しいです。σ加法族とかルベーグ積分が出てきたり(フーリエ解析まで?)、固有名がズラズラと出てくる手法があったり、論争の歴史があったり、数学のような演繹やそれでいて丸暗記のようなとらえどころがない面があり、そしてなにより全学問分野との関わりがある(法律学はどうかなとは思いましたが)ものです。哲学的な言い方をする人もいます。
こんなの理解している人いるのかなと言いたいぐらいです。専門が他にあって確率統計的な面もあるような人たちが本を書いているからこうなるのかなと思うのですが。富士山を静岡側だけから見ているとか。
No.3
- 回答日時:
企業で統計を推進する立場の者です。
どうもエセ本というかヤバい本を入手されたようです。
ご質問者が書かれた「その2つが『同一母集団から抽出された』と言っていいかどうかを調べる。」は、大きな間違いです。
主張したいのは「○○間には差がある」ということですが、一般にはこれを対立仮説とします。
対立仮説が採択されなかったときは、帰無仮説を棄却できなかったのであり、帰無仮説が採択されたのではありません。
そのときの結論は「○○間には差があるとは言えない」のであって、「○○間には差が無い」と言いきってはいけないのです。
つまり、帰無仮説が棄却されれば「その2つが異なる母集団から得られた標本である」と言えますが、帰無仮説が棄却されないときに「同一母集団から得られた標本である」と主張するのは間違いです。
その本の記述は、後者に言及しています。クワバラ・クワバラ。
(#1さんは間違いを述べており、#2さんは(たぶん分かっていて)言及を避けてみえます。)
次に、仮説を設けるかどうかの記述ですが、これは少し複雑です。Fisher の有意性検定とNeyman–Pearson の仮説検定があるからです。
テキストによっては、Fisher の有意性検定とNeyman–Pearson の仮説検定を明確に区別する場合があります。そのテキストが仮説を設けることを明確に書いていないのだとすれば、初学者向けに難解さを避けているのだと思います。
Fisher の有意性検定は、ある統計量の理論分布中の相対位置(乖離の程度)を調べることによってレアなことが起きているかどうかを検定します。「差が有意だ」とは言いますが、帰無仮説が棄却されたとは言いません。代表的なものは分散分析です。
Neyman–Pearson の仮説検定は、二つの過誤を用いて、検出力(1-β)を担保しながら、対立仮説の成立性を論じます。
一般のテキストにある仮説検定は、Neyman–Pearson っぽいですが、行われていることはFisher 流です。それは、検出力(1-β)にまで注意を払っていないからです。
最初の話に戻りますが、どんなケースでも「差がある」ことを主張したい訳ではなく、「差が無い」ことを主張したい場合もあります。このときは「差が無い」という主張が対立仮説になります。これを同等性の検定とか非劣性の検定と言います。かなり面倒な方法です。でも、「差が無い」ことの成立性がキチンと担保されます。
ジェネリック医薬品が先行薬と同等であることを、初学者向けテキストに書いてある方法で検定することはできません。
よく、企業のQCサークル指導者が問題を作って、このトラップに引っ掛かります。企業の人が書いている「よく分かる・・・」的なテキストは買わない方が良いです。
回答ありがとうございます。私も質問で、”同一母集団から抽出されたことを言いたい”というのは言い過ぎたかも、と思いました。「差がある」「差がない」「同一母集団から抽出された」についてはそれを論じることが目指す目的があると思います。2学級間の学力の同等性が担保されたので補習授業はやらなくていいね、とか、アンケート調査の対象に偏りがない(恣意的に選んだわけではない)ことが示せたとか、です。本にそこまで書いてもらったらわかりやすいかもしれません。
難しい面が多いのでテンプレートとして出来上がった検定の実用例に自分のデータを流し込んでブラックボックス的に使うほうがいいのかなと思ったりしました。そういう意味で”目的”と”結果”を書いてほしいと思っていました。今、何やってるんだろう?という気持ちになったので。
No.2
- 回答日時:
検定とは、端的にいえば
・仮定したことが、統計的に起こり得るか
を調べることです。
ある統計分布(要するに出現する確率分布です)を考えたときに、「確率○○% の範囲内に入るかどうか」を調べ(その確率○○%が「信頼度」、「1 - 信頼度」が「有意水準」)
・その範囲内であれば、統計的なバラツキによって起こり得る
・その範囲外であれば、通常の統計的なバラツキによっては起こり得ない
を判定して、後者であれば「有意である」(その現象が起こるのは、バラツキによってではなく、しかるべき理由があって起こっている、それが起こる理由・意味がある=有意である)と判断します。
つまり、後者であれば「仮定した通りだとすれば起こりえない」「仮定が間違っている」と判断します。
(ただし、それは「決定論」ではなく「統計的な確率論」で、ということ)
検定の中身、つまり「何を仮定するか」が、「2つの標本の比較」であったり、「母集団と標本の比較」であったり、「規範データと特定データとの比較」であったり、さまざまです。
>確率統計はいろんなものを対象にしているので本の書きぶりに幅があって、かつかなり暗記的な部分(60点とか95%とか、対象とそれが従うべき分布とか)もあり、腰が定まらない感じがします。
「統計的な確率論」で論ずる以上、「60点」などというデータは「統計的に処理できる標準データ」に変換しないといけませんし、どんな確率分布に基づくものと仮定するのかによって、使う分布もまちまちになるのは当たり前でしょう。
その最も根本的な基本を理解していれば、ご質問のような疑問は出てこないと思いますが?
>定期試験の合否なら、
「定期試験の合否判定」は検定ではありません。
「確率論」ではなく「決定論」で決めるでしょう、ふつうは。
この書き方を見る限り、上に書いた「検定のココロ」を全く理解できていないみたいですね。
仮に「統計的な確率論」で決めるのであれば、その「60点」をどうやって決めるのか、というところが「検定のココロ」です。(毎回60点ではあり得ない、毎回合否判定ラインが変わる、ということは分かりますね?)
回答ありがとうございました。今回の質問の主旨は、”検定”という言葉が目的(入口)ありき、ということで、検定の結果(出口)がそれに伴うという図式となっているということの確認でした。定期試験云々はそのたとえということで内容とは直接に関係しません。”検定”試験という言い方もありますが、入り口:この人は合格か? 出口:Yes or No という図式のたとえです。
なぜ、このような疑問が生じたかというと、例えば本によると、”母平均の検定”とか”分散比の検定”という言葉が出てきて、混乱してしまったからです。文脈依存ということでしょうから、全体を通して何を言っているのか理解するべきですが、”母平均の検定”とは”2つの標本のそれぞれの平均値による標本の等質性の検定”の略ではないかと思ったのです。つまり、目的として標本が作為的に作られたものではないことの証左とでもいうのでしょうか。視聴率とかアンケートとかの有効性の証明というようなことです。そういうことなのでしょうか。そういう風に考えると単純に”母平均の検定”といわれると何をしているのかわからなくなってしまう印象を受けました。”母平均の区間推定”だったらわかりやすいですが。一方、”仮説”検定はその辺が明確に示されていますね。仮説が提示されているわけですから。
検定とは常に検定されている内容(目的)を意識するべきであり、明示されるべきであり、念頭におくべきである、ということです。端的に言うと”母平均の検定”ではなく、”(母)平均による検定”(母平均は未知なのでひっかかりますが)ということです。私の質問は当たり前過ぎなのかもしれませんが。いかがでしょうか。
No.1
- 回答日時:
「2つの標本があって、その2つが同一母集団から抽出されたと言っていいかどうかを調べる。
これが検定である。」この場合の仮説は、「その2つが同一母集団から抽出された」
ですね。どちらも同じことを言っているものだと思います。
1.2つの標本があって、その2つが同一母集団から抽出された。と仮説を立てる。
2.その仮説が満たすべき条件を設定する。棄却域・採択域とか。
3.その標本が2を満たしているかどうかチェックして判定する。
で、どうでしょうか。
早速の回答ありがとうございます。検定されるべき課題が事前に提示されている、ということですね。本を読んでいるとそれが明示されていないことがあるような気がしてお尋ねしました。今、何をやってるんだろう???ということです。ある報告書で....t値は...、p値は....とか書いてあり、だからどういうことを言っているのかがわからないような報告書でした。当たり前なのかなと思って質問しそびれるということにもなりました。標本にバイアス(作為的データであったり、都合のいいデータだったりとか)はかかっていない(らしい)ということが確認されたっていうことですね。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
エクセルのグラフから半値幅を...
-
EXCELにてローパスフィルタを作...
-
卒業論文のアンケートの数について
-
死傷者数と死者数の違いって何...
-
データ点を線で結ぶ場合と結ば...
-
【統計】有意に「高い」?「低...
-
統計について
-
下の対数表示のグラフから低域...
-
検量線の決定係数について
-
ノンパラメトリック検定の多重...
-
理科のグラフで、直線と曲線の...
-
2郡の共通の標準偏差とは
-
t検定を繰り返してはいけない理...
-
極値をもつ時と持たない時、単...
-
心理機能診断をしたのですが、...
-
パイロットサンプルって何ですか?
-
インチ定規は違法ですが、目盛...
-
統計学の質問【帰無仮説】 B大...
-
フーリエ変換と離散フーリエ変...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
サンプル数の異なる2群間にお...
-
EXCELにてローパスフィルタを作...
-
下の対数表示のグラフから低域...
-
検量線の決定係数について
-
エクセルのグラフから半値幅を...
-
死傷者数と死者数の違いって何...
-
線形なグラフとはひとくちに言...
-
【統計】有意に「高い」?「低...
-
データ点を線で結ぶ場合と結ば...
-
アンケートの集計分析の基礎(...
-
アスピリンの加水分解のPHプロ...
-
最小二乗法を反比例の式を元に...
-
パイロットサンプルって何ですか?
-
対応のあるt検定の結果の書き方
-
統計について
-
数3の問題です y=x+cosx 0≦x≦2π...
-
理科のグラフで、直線と曲線の...
-
片対数グラフと傾き・切片の出し方
-
片対数グラフで…
-
エミッタ接地トランジスタの静...
おすすめ情報