gooドクター有料プランが1ヶ月間無料!

確率統計における検定についてお尋ねします。
ある本には、2つの標本があって、その2つが同一母集団から抽出されたと言っていいかどうかを調べる。これが検定である、と書いてありました。
一方で仮説検定ということになると、検定の前に仮説が提示され、その仮説が成立するかどうかを検定するということになると思います。

この2つの"検定"に対する説明は微妙に違うようにも思えます。前者は仮説が明確に提示されていないからです(暗黙的には提示されている)。

検定とは、
1.仮説を提示する。(明確に提示されていないなら明確化する)
2.その仮説が満たすべき条件を設定する。棄却域・採択域とか。
3.その標本が2を満たしているかどうかチェックして判定する。
ということでいいでしょうか。

定期試験の合否なら、
1.この学生はこの科目を習得している
2.試験で60点以上の得点がある。棄却・採択の閾値が60点
3.試験を採点する。

確率統計はいろんなものを対象にしているので本の書きぶりに幅があって、かつかなり暗記的な部分(60点とか95%とか、対象とそれが従うべき分布とか)もあり、腰が定まらない感じがします。
どのようなものを相手にしてもこのような解釈が成り立つでしょうか。

よろしくお願いします。

A 回答 (24件中1~10件)

No.24=23=19=14=7です。


 Coin C を10回投げます。表表表表表表表裏裏裏と出ます。3つの見方があります。1つ目は標本を2つだと見ます。前半の5回と後半の5回は同じ coin を使っているのでしょうか?と計算してどのくらい同じ coin かの値が出ます。
 標本           母集団
 表表表表表        表しか出ません
 表表裏裏裏        けっこう裏が出ます
2つ目は標本を1つだと見ます。11回目は表と裏どちらが出るでしょうか?と計算して7:3で表が出やすいと値が出ます。
 標本           母集団
 表表表表表表表裏裏裏   けっこう表が出ます
3つ目は coin Cは表と裏が同様に確からしく出ると仮説します。
 標本           母集団
 表表表表表表表裏裏裏   けっこう表が出ます
              表裏が同じ割合で出ます。
1つ目は標本と標本を比べてどのくらい同じか仮説します。2つ目は標本の続きを仮説します。3つ目は coin Cは表と裏が同様に確からしく出ると仮説します。
    • good
    • 0

No.23=19=14=7です。


 No.20さんが言う「仮説「コインCは偏っている」を立てたってしょうがない。それじゃ確率が計算できないからです。」がよかったです。Coin C を10回投げます。標本が1個なので同一母集団から抽出されたものか検定できません。
 表表表表表表表裏裏裏
 No.18さんの壺の中の白玉と赤玉がよかったです。「「壺A,Bにはそれぞれ10000個の白玉が入っている。壺Aに1個の赤玉、壺Bに5個の赤玉を追加した。さて、どちらかの壺Xから1個だけ玉を取り出したら、それは赤玉だった。壺Xは壺Aであるか壺Bであるか」」です。鍋AとBにはそれぞれ100gのお湯が入っている。鍋Aに1gの塩鍋Bに5gの塩を追加しました。どちらかの鍋Xから1gだけ液体を掬って舐めたらしょっぱかったです。鍋Xは鍋Bです。Coin を無限回投げることに対応するのは玉を取り出して戻してまた取り出すのを無限回することです。壺の中のたまを全部取り出すことに対応するのは裏と表が出るのが同様に確からしいことです。
標本            母集団
Cの1から10回目までの結果 Cの1から無限回目までの結果
              偏ってない coin の1から無限回目までの結果
赤玉1個         壺A全部で10001個の玉 赤が1個白が10000個               
             壺B全部で10005個の玉 赤が5個白が10000個
1gの塩っぱい味噌汁    鍋A全部で101gの味噌汁 塩が1gお湯が100g
             鍋B全部で105gの味噌汁 塩が5gお湯が100g
    • good
    • 0

No.21へのコメントについて。



> 2はHの生死不明でしょうか。

 いいえ。生でも死でも生死不明でもない。(「ピーターパンさんは現在、生きてますか?死んでますか?生死不明ですか?」という問いは3択問題ではない。なぜなら、もともとないものの生死を問うのは無意味ですから。)
 「帰無仮説が採択される」ということは絶対にない。だから、「帰無仮説が採択されるかもしれない」なんてことも絶対にない。肯定される可能性が最初から全くないものを、なんで「保留」したがるんですかね。単に、もともとなかった。それだけです。
 さて、同じデータで別種の統計解析をやる、あるいは新しく実験し直して統計解析するとします。その際に、その目的のために、新たに帰無仮説を立てますね。で、その仮説がたまたま、過去に忘れて捨て去った帰無仮説と同一であっても構わない。(これを留保だの復活だのと解釈することには、「忘れ去ったとか言いながら、本当は忘れていなかったからこそ、同一だと気がつくんだ。ああ、未練だなあ。未練、未練、♪〜昔の名前で出ています」てな調子で、詩的な意味しかないでしょう。というのは、今度の統計解析でも、帰無仮説が忘れて捨て去られることは最初からわかっているからです。)

> 冒頭に"締めくくり"と書きましたが、それがない論文・報告集があってt値を示してそれで終わりというのがあってだから、....と言って締めくくってほしいと思いました。

 論文の話と統計の話を一緒くたにしちゃダメです。
 統計の計算をやっただけでは、計算結果しか書けません。当たり前。
 一方、「だから、....と言」うには、決断が必要であり、どう決断するかは目的・価値観・責任によります。例えば、「期待値がマイナスだとわかっているのに宝くじを買う」という決断は、決して不合理ではない。確率や統計は「期待値がマイナスだ」までしか扱わない。「宝くじを買う」かどうかの決断には口を挟めません。

> 実験などやって”何も言えない”ということは原理的にありうるでしょうか

 そりゃ、いくらでもある。当たり前です。(こんなキホンで躓いてるのだとすると、もしかして、調査や実験を自分で計画して実行したご経験がないのかな?)
 一般相対性理論が本当に成り立つか調べようと思って、自宅の屋根の上と土間とで腕時計がどれだけズレるかを実験したらどうなるか。日本に宇宙人が何人いるか調べようと、クラスメイトに「あなたは宇宙人ですか?」というアンケートをしてみたらどうなるか。
 対象とする現象を捉えるのに、測定精度、繰り返し回数、条件のコントロールなどが足りない調査・実験(要するにオオザッパすぎる調査・実験)をすれば、「この実験・調査だけでは何も言えなかった」という結論に至るしかありません。

> ベイズの事前・事後確率とか、情報理論的にみて実験前後では何か違いがあるということになるんじゃないか

 検定の話とベイズ推定の話は、やろうとしていることがあまりにも違うんで、一緒くたにしちゃいけません。
 ベイズ推定は「信念をパラメータの分布で表現する」という考え方です。「ベイズの定理」とは全然違う話で、似ているのは式だけ。(とてもややっこしいんで、検定ごときで混乱する人は手を出すべきじゃないと思います。)
 それはさておき、「情報理論的にみて」だと、実験「屋根の上と土間とで腕時計がどれだけズレるか」の実験結果が、ごくわずかでも意味を持つかどうか。実験を繰り返すと、p値の最尤推定値(99%よりずっと高くて、ほぼ確実に、帰無仮説が棄却できない)の小数点以下百桁目より先ぐらいに違いが出ることが稀にある(それは、p値の推定誤差に比べてもはるかに小さい)という程度の意味を持つでしょう。しかし、(腕時計ではなくて)正確な時計を使って実験すると、p値は100万分の1より小さくなる。
(p値は帰無仮説だけで決まるのではなくて、「どんな実験か」に決定的に依存するんだ、と言えば伝わるかなあ。)
    • good
    • 1

No.20について、もしかしたら誤解されるかもしれんところがあるので訂正します。



>> この実験を根拠にして「コインCは偏っている(Hの否定)」と主張したときに、それが、【「この実験を根拠にして「コインCは偏っている(Hの否定)」とは言えない」という主張をすべきところを、誤って、「この実験を根拠にして「コインCは偏っている(Hの否定)」と主張する」ということをやらかしたのである確率】がpである。

むしろ、

この実験を根拠にして「コインCは偏っている(Hの否定)」と主張したときに、それが、【「正しくは「この実験からは何も言えない」とすべきところを、誤って、「この実験を根拠にして「コインCは偏っている(Hの否定)」と主張する」ということをやらかしたのである確率】がpである。

と表現した方が良かったかな、と。
    • good
    • 1
この回答へのお礼

懇篤な回答ありがとうございます。

検定を行った後の"締めくくり"の最後の言葉ですが、以下のように分類されるということですかね。
1 ...より,Hは棄却される
2 ...より,Hは棄却されるとは言えない。(...とは言えない とか 何も言えない とかが正解)
3 ...より,〇〇の確率は〇〇である。<-これは一切ない,というご説明ですね。

2になったらHの出番は全くない、ということですね。
1の方はHは棄却されたという意味で出番はなく、2の方はHは復活する可能性がある、すなわち1はHの死亡宣告、2はHの生死不明でしょうか。
そのため、2でHの出番がないというところに引っ掛かりました。死亡していないので。

冒頭に"締めくくり"と書きましたが、それがない論文・報告集があってt値を示してそれで終わりというのがあってだから、....と言って締めくくってほしいと思いました。それがこの質問の元々の動機(に近い)ものでした。

実験などやって”何も言えない”ということは原理的にありうるでしょうか。ベイズの事前・事後確率とか、情報理論的にみて実験前後では何か違いがあるということになるんじゃないかと思いましたが。ご指摘(何も言えない)はそういう意味ではなかったかもですが。

お礼日時:2021/10/04 21:41

No.18へのコメントについてです。



> 一般の名詞なので内容や実態と直結する方がいいはず、と思っていました。

 確かに、ガイジンの名前を冠してくれた方が、用語全体が1個の固有名詞であることを思い出しやすいでしょう。特殊な意味を持つ用語(=固有名詞)なのに、ごく普通に使う言葉をごく自然に組み合わせた形をしている、ってのが最も危険ですね。分かった気になっちゃって、どういう意味だっけ?という確認を怠りがち。よほど注意していなくてはいけません。

> ”棄却されない”に留まる,という留保があるということでしょうか。
> 対立仮説も、”棄却”か”棄却されない”であり、"棄却”か"採択”ではないと。

 全然違います。No.18に書いた通りです。再度書きますと、(a)もし帰無仮説が棄却されたら帰無仮説の否定を主張する。(b)もし帰無仮説が棄却されなかったら何も言えない。以上です。だから、検定が終わった時点以降、帰無仮説には全く意味がなく、従って、留保なんかされません。否定されるか、無かったことにされるか、どちらかです。
 さらに、「対立仮説」なんて概念には、どこにも出番がありませんから、こんなナンセンスな用語は忘れてください。
 ところで、実験を計画する際に、サンプルをいくつ取ればいいかな、という予想を立てる。そのとき、「きっとこうなってるはず」という仮定の上で、「検定で有意差を出すのに必要な、最低限のサンプル数」を計算します。で、この仮定を「対立仮説」と(誤って)呼んでいる本を見たことがあります。正しくは、その仮定は「作業仮説」と呼ばなくてはなりません。作業仮説は検定自体とは関わりがない。帰無仮説が棄却されたからといって、作業仮説を「採択」する理由には全くならない、ってことはお分かりになるでしょう?

> ”帰無仮説が棄却され対立仮説が採択された”と言い切ったら

違います。検定によって「対立仮説が採択された」りは決してしません。「対立仮説」という概念自体が無意味であり、「採択」なんて概念も無意味だからです。そういうアホな論文が通るのは、いまだにネイマン・ピアソン流を格好だけ真似して足れりとしているような、特殊な分野の三流雑誌においてだけです。(が、そういう雑誌は実に多いんですよね。)
 作業仮説を「対立仮説」と(誤って)呼ぶことと、「帰無仮説が棄却され対立仮説が採択された”」という誤りが重なると、「帰無仮説が棄却されさえすれば、どんな仮説でも採択される」という悪夢のような誤りが生じることになります。

> ご指摘の点は"採択=無条件パス"などと本気で思った(信じた)事例

 違います。幾ら何でもそんなデタラメ論文は当然rejectです。
一方、No.18で言っているのは(そんなアホな話ではなくて、)単に「検定をやった」というだけの理由で(検定の目的や結果の如何に関わらず)自動的にrejectする雑誌すらあるよ、ということです。(それらの雑誌は、自分たちは「特殊な分野の三流雑誌」なんかじゃない、と言いたいわけですけれども、でも実態としては、中身をきっちり見るだけの実力がないもんだから、形式的に判断しちゃってる。その程度の、やっぱり三流だということです。)

> それをひとまず認めて先に進んでみようという態度

 もちろんそういう議論の進め方はアリです。そして、そのためには、単に検定をしなければ良いんです。すなわち、p値を計算したら、そこまででやめとけば良いだけのことです。そして、「以下の話は、確率pで誤っているかもしれない」ということを示した上で、「仮に誤っていないなら....」と論を進めるのは、まっとうな話です。
 検定なんか単にやめときゃいいものを、なんでやりたがるのか。もちろん、以後の論証において、検定の結果をあたかも確定した事実であるかのように使う、という詭弁をやるためです。

> 確率・統計は帰納的だと思います

 違います。確率は数学であり、完全に演繹的です。また、統計は過去(あるいは特定の事例)の結果の記述手段であり、統計自身が帰納的なのではありません。「その記述が将来にわたっても(あるいは他の事例においても)通用する(斉一性)と仮定する」と、以降が帰納的推論になる、とうだけのことです。

> 検定が科学技術論文のメインになりうる

 何をメインと思うかはご自由でしょうよ。

> 検定はある種の論考における仮説において箸にも棒にもかからないわけではない

 No.18に書いたと思うのだが、現実の世界の中で責任を持って決断をする、そのために検定を使います。どう有意水準を設定するか。それは「決断が誤る確率(すなわちp値)」と「決断が誤った時の被害の大きさ」、この両方を勘案して決めるわけです。ですから、「決断が誤った時の被害の大きさ」がきちんと検討してあれば、検定には意味があります。そして、その検討が統計ナンゾの問題ではないのは明らかでしょう?

> 有意水準については、学科の単位取得、資格取得の試験勉強の事例がそのまま定着してしまったようなものですかね。

 おっしゃる意味が理解できんす。
 さておき、コメントを拝見して、どうも概念を正確に捉えないまま、印象でものを仰っているんじゃなかろうか、と思いました。最初にロクでもない「教科書」を読んでしまうと、混乱した話が頭に入ってしまって、概念を的確に捉えられなくなる。もしかすると、そういう被害者の方ではなかろうか。

 というわけで、一つ例をだしてストーリーで説明してみます。

 「あるコインCは偏っているか?」という問いを考えます。この際に、仮説「コインCは偏っている」を立てたってしょうがない。それじゃ確率が計算できないからです。なので、
  H:「コインCは偏っていない」
という仮説を立てる。この仮説の意味するところは、「コインCを投げて表が出る確率は0.5(0.49999999でもなく、0.5000001でもなく、キッカリ0.5)である」ということです。もとより、「コインCを投げて表が出る確率はキッカリ0.5である」だなんて、まるでありえない、荒唐無稽な話です。それを仮定することで、数学の確率論の世界に話を移す。これが帰無仮説です。
 さて、実験をやる。コインCを10回投げたら、7回が表だった。すると、Hの仮定のもとでは「10回投げたら、7回以上が表」という事象が偶然に生じる確率pが正確に計算できる。これは
   × 【命題「コインCは偏っていない(H)」が正しい確率】がpである。
ではなく、全く同じ意味ですが、
   × 【命題「コインCは偏っている(Hの否定)」が誤りである確率】がpである。
ということではないし、さらに
   × 【命題「コインCは偏っている(Hの否定)」が正しい確率】が1-pである。
という意味でもない。どれも間違いです。正しくは、
   ○【「この実験を根拠にして「コインCは偏っている(Hの否定)」という主張をすること」が誤っている確率がpである。
という意味です。言い換えると、
  この実験を根拠にして「コインCは偏っている(Hの否定)」と主張したときに、それが、【「この実験を根拠にして「コインCは偏っている(Hの否定)」とは言えない」という主張をすべきところを、誤って、「この実験を根拠にして「コインCは偏っている(Hの否定)」と主張する」ということをやらかしたのである確率】がpである。
という意味です。
 (ここを誤解する人が物凄く多い。簡単な数式を丁寧に読めば間違えようがないはずなのに、長年統計を扱っている人でも間違える。)

 さて、検定をやるとなると、有意水準αが決まらなくちゃならない。それは一体何を決断したいのかによるわけです。偏ったコインを探してコレクションしたいのか、あるいは、コインCを使った奴をイカサマ師だと断罪して殺すための決断をするのか、そういう文脈によって有意水準αを設定するわけで、ここは統計が口を出すところではない。
 そして、α<pだったとすると、Hが棄却されない。つまりこの実験は「コインCは偏っているか?」という問いに全く何の答も出せなかった、ということです。以後、H(という荒唐無稽な仮定)に出番は全くない。
    • good
    • 0

No.19=14=7です。


 検定に対応します。1つ目は集まりと集まりを比較します。例えばチカグレロルの心血管イベント予防効果はクロピドグレルを上回らないです。比較できます。
 定期試験の合否に対応します。2つ目は要素と集まりを比較します。例えば中学の母集団で偏差値が60だった人が大学の母集団で偏差値が50です。https://b.hatena.ne.jp/entry/4708488307963726434 …さんは母集団が違うので比較できないと言います。母集団が違うからの他にも理由があります。それは中学校の試験と大学受験の模試が違う内容だからです。
標本                    母集団
芥川龍之介さんの大正15年と昭和2年の読点  書物の読点
チカグレロルの人とクロピドグレルの人の様子 人類の様子
模試を受けた人たちの得点          大学受験する人たちの得点
ー上は標本から母集団を推定します。下は標本と母集団が同一です。ー
ある中学校のある学年のある組の全員の国語の試験の得点
ある年のある学年の中学生全員の国語の試験の得点
 1つ目は母集団のなかに小さな母集団が2個あり小さな2個の母集団を比較します。2つ目は1人の学生は標本の中の1要素です。1要素と属する標本を比較します。1人の学生が組の中でどのくらいできているかわかります。同じ人の中学2年生と高校3年生を比較できません。芥川さんの大正15年と昭和2年を比較できます。母集団が違うのは同様です。試験と模試が違うからです。読点の数と読点の数が同じだからです。

胃人さんおはようございます。
    • good
    • 0

[1] 「母平均の検定」という用語が気に入らない、と仰るセンスは健全だと思います。

けどね、用語ってのは単に憶えやすくするための固有名詞、ただの記号ですから、個々の文字が意味を持っていると思っちゃいけません。すなわち、「母平均の検定」を「母平均」の「検定」ということだと解釈するから気に入らないんですよ。(「大谷翔平」を「大きな谷を平たく翔ぶんだな」と解釈して、えーと、どうやって?ハングライダー?とか言ってるのと同じです。)で、用語「●●の検定」が何を意味するかですけど、これには揺らぎがある。すなわち、(1)「検定すべき仮説」 (2)「検定すべき仮説」×「その検定に使う確率論」のセット、というふた通りの解釈があるんで、多少混乱します。本来の意味は(1)であろうかと思いますが、(1)の目的のために便利で性能の良いダントツの方法が一つ知られていて、広く使われている、という状況において、(2)の意味が派生するんだ、と思います。

[2] ネイマン・ピアソンの検定には「帰無仮説」なんて概念はありません。「検定仮説 vs 対立仮説」の勝負をやるんです。これに対して、「検定仮説も対立仮説も、どっちも間違いかもしれんよ」という、実にもっともな批判をしたのがフィッシャーの検定で、こちらは「帰無仮説」だけがあって、「検定仮説」も「対立仮説」もなく、検定の結果は(a)帰無仮説が否定されるか、(b)何も言えないか、のどちらですから、帰無仮説が「採択される」ということはどうしたって起こらない。なので(a)(b)いずれにしても帰無仮説は無に帰すしかないわけです。
 論理的に考えればフィッシャーの方に明らかに分があるわけで、ネイマン・ピアソン流をいまだに使っている心理学や教育学の分野は、hard scienceの人たちからは相手にされてない。実際、これらの分野の教科書には「帰無仮説か対立仮説を採択する」だなんて自己矛盾したことが平気で書いてある。「やり方を真似する」だけのhow to本だからこういうハジを晒すんです。
 とは言っても、フィッシャーの検定が万能というわけではない。例えば「壺A,Bにはそれぞれ10000個の白玉が入っている。壺Aに1個の赤玉、壺Bに5個の赤玉を追加した。さて、どちらかの壺Xから1個だけ玉を取り出したら、それは赤玉だった。壺Xは壺Aであるか壺Bであるか」という問題において、α=0.001でフィッシャーの検定をやると、「壺Xは壺Aでも壺Bでもない」という結論に至るでしょう。この場合、「壺XはA,Bどちらである蓋然性が高いか」を問うべきところを、検定を使ったのが不適切、ってことですね。

[3] 近頃では、検定自体に対する批判が強い。(検定をやってる論文は無条件でrejectする、という専門誌もいくつもあり、それが過激かどうかはともかく)批判の出発点は「有意差あり、となった途端に、それが確実な事実であるかのように論を進める、というのはおかしいでしょ?」ということであったわけですが(そこまでアホな論文はrejectで良いと思いますが)、もっと本質的には、「せっかくp値を計算しているのに、それを有意水準を超えるか超えないかの2値に振り分けてしまう。情報を捨てて、一体何が嬉しいんだ?」ということです。これを言い換えると、検定は統計学の範疇をはみ出している、ということ。
 もう少し説明しますと、もともと、検定をやろうとする動機は、何らかの決断をするためです。様々な現実の文脈の中で、どれだけのリスクを取って決断するか、という際に、そのリスク(=発生確率×重大性)のうちの発生確率の部分、すなわちp値を計算しているのが統計です。しかし、重大性については、当然ながら統計の知ったことではない。で、実務上、p値がごく小さい時には、重大性の見積もりは大雑把でも決断に影響はないから、その見積もりに手間を掛ける必要はない。しかし、あんまり小さくないp値ですと、重大性の量的・質的な見積もりをきちんとやって、リスクをなるべく正確に把握した上で、決断する。それが合理的なスジってもんですよね。なのに、統計学が、現実の事情も知らないくせに「普通は1%とか5%です」だなんて、イーカゲンな口を出すのは、お笑いグサどころか、笑止千万ですよね。
 「あらかじめ有意水準を決めておいてから検定をやれ」というスローガンは、「重大性の見積もりができていて、さらに、許容できるリスクの判断が決まっていれば、有意水準があらかじめ計算できる」という意味でなら正しいわけですが、だからってどうしてもあらかじめ計算しなきゃならんわけではない。それを単に(大抵のhow to教科書のように)「先に有意水準を決めてからp値を計算しろ」というだけの意味に解釈しているんであれば、そんなのは精神主義のナンセンスに過ぎません。(フィッシャー自身、「『有意水準が例えば5%...』なんてことをうっかり書いたために、それが一人歩きしちゃった。あれは失敗だった」と言っている。)
    • good
    • 0
この回答へのお礼

懇篤な回答ありがとうございます。

”母平均の検定”は、ある本の章立ての中に出てきてそれが何を意味しているか、判然とせず明確にしたいので質問しました。内容をよくみると、標本から得られた情報から”母平均μが a である”ことを検定するという主旨がわかったので、そのようにひとまずは頭に整理しました。この章の名前では頭の中の引き出しに整理できないと思ったのですが、だいぶ整理された感じです。
固有名だったら何も疑問はないですが、一般の名詞なので内容や実態と直結する方がいいはず、と思っていました。名前は引き出しのフラグ名なので。

>検定の結果は帰無仮説が「採択される」ということはどうしたって起こらない。

検定の場合、"棄却"はいいが その逆は”採択”ではなく、”棄却されない”に留まる,という留保があるということでしょうか。
対立仮説も、”棄却”か”棄却されない”であり、"棄却”か"採択”ではないと。

もし、”帰無仮説が棄却され対立仮説が採択された”と言い切ったら論文リジェクトの憂き目にあうということですが、それをひとまず認めて先に進んでみようという態度はありかも、と思うのですが。それが本当にダメだったらいずれ論考が破綻する、そのリスクを取るという覚悟で先に進むということです。破綻したら、どこかで修正する(取り下げも)というのが科学の態度ですね。科学の論証とは常に否定される可能性を含意したものなので。ご指摘の点は"採択=無条件パス"などと本気で思った(信じた)事例ですね。

※確率・統計は帰納的だと思いますが、数学は演繹的です。帰納的学問はちょっとだけはみ出すことがある程度許容されるものかなと思うのですが。演繹だったら是々非々が明確。

>検定をやってる論文は無条件でrejectする

検定が科学技術論文のメインになりうるでしょうか。検定はある種の論考における仮説において箸にも棒にもかからないわけではない、という程度のものとみなすということですが。逆に"箸にも棒にもかからない”ということになると方向転換になりますが。

有意水準については、学科の単位取得、資格取得の試験勉強の事例がそのまま定着してしまったようなものですかね。対象ごとにいろいろあっていいはずですが。 以上、散文でした。

お礼日時:2021/10/02 12:48

#16です。



ご質問者様は、初学者だと謙遜されながら、フィッシャーとネイマン・ピアソンの違いを感じ取られるほどの造詣をお持ちの方と拝察致しております。

高い視点からの感想を読み、私も色々と考えさせられました。

私は企業内で統計教育を担当していますが、単純そうで奥深い話をどう消化して伝えるか、という課題を改めて認識しました。

どうもありがとうございました。
    • good
    • 1
この回答へのお礼

ありがとうございます。途中で投げ出して再入門をくり返しているので”入門者のプロ”にでもなっているのかもです。入門という本も多数あり、いくつ門があるのと聞きたくなります。そう言う理由もあって入門者の困難から抜け出せない状態なのかもです。今回の知識を整理して引き出し入れるようにします。

お礼日時:2021/09/24 14:14

恥ずかしい事例をご紹介します。



「些細な差でも有意になる」という事例(誤用事例)です。

Yの付く会社では、膨大な数のA/Bテスト(これは統計の世界では一元配置の分散分析)を行った結果、たかだか0.64%の違いについて、「差がある!」と言っています。毎日毎日の誤差に埋もれるような値です。
とんだ恥さらしです。

https://japan.cnet.com/article/35038210/

こんな仕事で高給が貰えるなら私もやりたい。
    • good
    • 1
この回答へのお礼

回答ありがとうございます。現在、長考中です。以下、感想と散文ですが。

確率論ってあまり難しくないと思われているのかなという印象があります。
サイコロとか袋の中の赤玉・白玉など日常的なものを題材にして語られるからですね。でも”帰無仮説を棄却する”(えーと、だからどうだったっけ、となる)とか”〇〇とは言えない、否定できない”とか論理学的な素養を要する面があります。それでいて、ビッグデータの時代となるとこれらの分野が時代の中心に出てきて、様々な学問分野でさらに活躍を始めているように見受けます。

私は、この学問分野が数学の一分野ならばその論理展開は演繹的に違いないと思ってきたのですが、帰納的、経験的な面があって常に幻惑されるような印象を持ってしまうのです。適用対象が常にデータ(実験・観測・調査)なので最終的なアウトプットは帰納になってしまうと見なせそうです。

保険数理のあのアクチュアリの本ってありますが、それを見ていると”かつて確率・統計は数学の一部とはみなされていなかった”(ブラックショールズあたりから数学になってきた)と、ありました。数学専門の先生に聞いてみても、学科の中で教員は講義をしたがらないとも言っていました。σ加法族とかルベーグ積分を使うとか数学としてとらえたらついてこれる人がいなくなりそうです。さりとて、代数幾何学とかの教科書(さらに誰も読めない)に比べたらはるかに易しい数学(四則演算と初等関数程度?)であり、その辺も幻惑の原因かなと思っています。

このようにとらえているので自分の中で座標をもって位置付けることが難しいと思うんですね。医学の”コロナやがんを撲滅する”という位置づけの単純さ(内容は難しさとは別)に比べて自分の中での立場の確立が難しいという感じなのですが。

長文ですみません。

お礼日時:2021/09/23 10:39

#14様、



いきなり、ハードルを上げてきましたね。

・同じ母集団に2種類の薬を投与することはできないので???です。
・P値の問題は最近提起されて話題になっており、タイムリーな講演で、大変参考になりました。

ただ、C-1~7はmodel に必要な仮定ではなく、確保すべき前提ですね。お間違え無きよう。
ただ、いずれかが確保されていないと、有意とみなされてしまうP値が出現する可能性があるので「それらが検定で分かる」とおっしゃっていますが、C-1~7のうち1~6は検定の本来の目的ではありません。これは講演者一流のジョークですよ。誰も笑いませんでしたが・・・。
ネイマン・ピアソンの仮説検定の目的は、講演でも述べられていたように、「帰無仮説の否定」です。


P値の問題について、補足しておきます。

【問】ある製品の特性値は、μ=5,σ=0.9だった。今回、性能向上のために工程変更を行った。従来と比較して平均値が大きくなったか検定せよ。

サンプルサイズをどうするか、研究者によって異なるでしょう。それにより研究者によって結果が異なってしまいます。
講演でも述べられていたように、サンプルサイズを大きくすると、常に有意になってしまうのです。平均値のばらつきは、σ/√n に従って小さくなるからです。

これまでは、効果量(effect size)併記で査読が通りましたが、今後はP値を使っているとリジェクトされる可能性があります。

対策は述べられていませんでしたが、私たちのグループはベイジアン分散分析への切り替えを進めています。
「確率・統計での検定の考え方」の回答画像15
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング