新生活を充実させるための「こだわり」を取材!!

平均:1.01,不偏分散:0.11^2,n:6の時、母平均が1であるかを両側検定し、p値を計算する問題で答えが「0.2以上」です。
解説にt値=(1.01-1)/0.11√6≒0.223となり、自由度5のt分布上測10%は1.476であり、0.223はこの値より小さい。両側検定なのでp値は2倍の0.2より大きくなるとあります。
この2倍は何を2倍しているのかがわかりません。「0.223」を2倍しているような気がしますが、「0.223」はt値であり、p値ではありません。両側検定のp値は片側検定p値を2倍することは理解していますが、解説の内容ではt値を2倍しているように思えます。そうするとt値=p値ということになりおかしな気がします。また問題に記載がないのに何故「上測10%」と勝手に決めつけているのかもわかりません。記載がない場合は「10%」とする等、暗黙のルールがあるのでしょうか。どなたかご教授頂けませんでしょうか。宜しくお願い致します。

質問者からの補足コメント

  • 問題全文等は文字数オーバーで記載負荷のため、記載漏れ部分等追記します(最初の質問文面でも殆ど網羅しています)

    ○問題追記
    ・独立に統一の正規分布に従う
    ・母平均が1kgであるか両側検定する時のp値
    ○解説追記
    ・母平均が1kgであるという帰無仮説の下で、t検定量は自由度5のt分布に従う。

    ・t値=(1.01-1)/0.11√6≒0.223

    と解説はt値しか求めておらず、その他の計算や説明文もありません。
    そうすると解説ではt値からp値を導き出しているとしか考えることができず、t値=p値というこということになってしまいます。
    やはり、0.223×2=0.446 でp値は「0.2より大きい」との解釈でいいのでしょうか。
    また有意水準見逃しの件も問題は4行足らずの文ですが「両側検定」の文言はあるものの、「上測10%」等、有意水準の記載はどこにもありません。

    No.1の回答に寄せられた補足コメントです。 補足日時:2022/01/23 15:08
教えて!goo グレード

A 回答 (3件)

No.1 &2 です。

「補足」を見ました。

そのような問題であれば、「母平均の検定」ということで、母分散が未知なので、標本からの不偏分散を使って「t分布」を使うということなのでしょう。

↓ 下記のようなことをするもの。
https://bellcurve.jp/statistics/course/9405.html

#1 にも書いたように、「t値」は「t分布における確率変数」の方であって「確率値」ではありません。
「確率値」は「有意水準」の方であって、「片側 10%、両側 20%」の「10%、20%」が「p値」です。

「自由度5のt分布上測10%は1.476であり」といったときの「1.476」は、自由度5のt分布で「それ以上の確率が 10% となる t の値が 1.476」ということです。
「両側」という観点でこれを表現すれば「それ以下の確率が 10% となる t の値は -1.476」ということです。
つまり、「t値が -1.476≦t≦1.476 である確率は 80%」ということです。
おそらくこれを
「t ≧ 1.476 の p値は 0.1」「t ≦ -1.476 の p値は 0.1」というように言っているのだと思います。

これであれば、t=0.223 は十分にこの「80%」の中に入るので(上下10%ずつの有意な範囲には入らない)、「有意ではない。統計のバラツキの範囲内と判定される」ということになります。


「両側検定なのでp値は2倍の0.2より大きくなるとあります」というのは、オリジナルの表現をどれだけ正確に書かれているのか分かりませんが、意味不明です。
「両側検定なのでp値は2倍の0.2になる」ということなら、上に書いたようなことなので理解できます。

これを、最初に立ち返って、質問の最初に

>両側検定し、p値を計算する問題

と書かれているのは、ひょっとして「これを有意であると判定するための p 値の大きさはいくらか?」というような問題なのですか?

自由度 5 のt分布における t=0.223 のときの確率値(p値)を求めよという問題ですか?
だとしたら、下記のようなt分布の「確率密度関数」から求める必要があります。

https://ja.wikipedia.org/wiki/T%E5%88%86%E5%B8%83

これは、通常の数学では歯が立たないので、「t分布表」を使って求めましょう、ということなのでしょうが、通常の「t分布表」には、いくつかの「有意水準(p値)」(1%, 2.5%, 5%, 10%など)に対応した「t値」しか載っていません。通常は、最大で「片側 10%」です。
↓ 例えば下記
https://ai-trend.jp/basic-study/t-distribution/t …

これから、「t分布表」を使って求めると、「少なくとも片側10%以下ではない。片側なら 10% 以上、両側ならその2倍の 20%以上」といっているのではありませんか?
それが答の「p値は 0.2以上」ということ。
    • good
    • 0
この回答へのお礼

やっと理解できました。上測10%点で1.476に対して0.223と中心に近づくので両側では20%以上ということですね。
t分布表の理解も標準正規分布表と同様、真ん中が確率を表すように思い込んでいましたが、正規分布表は中身が確率なのに対して、t分布・χ二乗分布は表の上側の数値が、さらにF検定では表外と、検定によって表の見方が違うことを初めて知りました。
ちなみに「両側検定なのでp値は2倍の0.2より大きくなる」は過去問解説全文です。
こちらの理解不足に加えて解説もはしょった解説のなのでさっぱり理解できませんでしたが、ご親切な説明で解決しました。
リンクも沢山つけて頂きお手数をお掛け致しました。

お礼日時:2022/01/23 20:15

No.1 です。

ちょっと補足。

#1 の (b) の「p値」は、単なる「確率の値」という程度の意味です。
つまり、確率変数の範囲に対して、「その確率変数の範囲に対する確率値」ということ。
    • good
    • 0
この回答へのお礼

確率の値の件、理解しました。
ありがとうございました。

お礼日時:2022/01/23 16:20

「問題」も「解説」もきちんと提示されていないので、憶測でしか回答できませんが。



(a) 「t値」云々というのは、いわゆる「t分布」を使って判定している。
 従って、
  t値 = 0.223 < 1.476
によって、「有意水準:片側 10%」という判定条件で「有意ではない」と判定している。

(b) 「p値」云々というのは、標本から母平均の「信頼区間」を求め、その信頼期間内に入るかどうかで判定している。
そのときに「両側各々10%が有意になるので、その間の 80% が信頼区間」としている。
この「両側各々10%、合計20%が有意」ということを「p値」と呼んでいるのではないでしょうか。
「片側 10%」を「信頼区間から除外する上側・下側の両側」にするために「2倍」しています。

従って、「t値」と「p値」は全く別物でしょう。

>また問題に記載がないのに何故「上測10%」と勝手に決めつけているのかもわかりません。

いやいや、「有意水準」というのは「判定基準」ですから、必ず「設定」しないといけません。「有意水準○%」「片側か両側か」は必ず指定しなければなりません。
あるいは「両側か、片側か」は「統計変数」の性格上自明であるとか。
いずれにせよ、問題のどこかに書いてありませんか?
この回答への補足あり
    • good
    • 0
この回答へのお礼

詳細なご説明ありがとうございました。
補足文面、追記させて頂きました。文字数制限があり要約しております。

お礼日時:2022/01/23 16:22

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

教えて!goo グレード

人気Q&Aランキング