よろしくお願いします。
初心者向けの(エクセルを使った)統計の解説本に次のような例題があります。
改良前の平均値 1500
改良後の標本平均値 1553
改良後の標本標準偏差 162.5541
改良後の標本の大きさ 50
有意水準5%で検定しないさい。
そこで,t値=2.313319
自由度50-1=49より,=TINV(0.05,49)=2.009597
t値2.313319は判定基準の2.009597を越えるので有意差有り というのが回答になっています。
以上の計算手順は理解できた上で質問です。
1 例題では改良前の平均値のみが与えられており,改良後は標準偏差や標本の大きさが与えられています。要するに「改良前の平均-改良後の平均の存在する範囲」の比較をしています。
もし,改良前も改良後も平均値,標準偏差,標本の大きさが与えられている場合,どちらを基準に考えればよいのでしょうか。つまり,「改良前の平均の存在する範囲-改良後の平均」を比較することもできると思います。例題はなぜ,「改良前の平均-改良後の平均の存在する範囲」の比較を行っているのでしょうか。
2 仮に,「改良前の平均-改良後の平均の存在する範囲」の比較でも,「改良前の平均の存在する範囲-改良後の平均」の比較でもどちらでもよいとするのなら,結果の解釈はどのように変わってくるのでしょうか。
素人質問で申し訳ありませんが,よろしくお願いします。
No.1
- 回答日時:
>以上の計算手順は理解できた上で質問です。
理解されてないと思います。
何か統計学の本で 帰無仮説とか 確率分布 とか 確率変数とかについて 学ばれたでしょうか?
確率変数が ある確率空間から実数またはベクトル空間への写像(可測関数)だと分かっていれば、そういう質問はしないと思うのですが。
早速御回答頂きありがとうございました。
計算手順が理解できているというのは,私が参考にしているエクセルを使った統計の本に書いてある手順(手続き)を順に行えるという意味で書きました。回答者様のレベルで考えますと理解とは言えないと思います。少なくとも私が「理解」と書いたのはまずかったですね。御指摘ありがとうございました。
No.2ベストアンサー
- 回答日時:
> 1
> もし,改良前も改良後も平均値,標準偏差,標本の大きさが与えられている場合,どちらを基準に考えればよいのでしょうか。> つまり,「改良前の平均の存在する範囲-改良後の平均」を比較することもできると思います。例題はなぜ,「改良前の平均-改良後の平均の存在する範囲」の比較を行っているのでしょうか。
例題の場合は改良前の平均には誤差がないものとして考えてますので「一標本の平均の検定」(Single sample t test)を行っています。
この場合では、「独立な二標本の平均の差の検定」(Paired t test)を行うことになり、どちらが基準というわけではありません。
貴方の言うところの「平均の存在する範囲」ではなく「標本平均の差の存在する範囲」で考えているのです。
少し話がずれますが、「平均の存在する範囲」という書き方が気になったので、検定について説明してみます。
「もし母平均が同じであれば、前と後の標本平均の差は0に近い値が出やすいはず。ならば0から大きく異なる値が得られたということは、前と後の母平均は違うのだろう」というのが平均の差の検定の考え方です(大雑把な説明ですが)。
そして、どの程度違えば良いのかは、母平均の差がないときの標本平均の差の分布を知らないといけません。
その分布から、(母平均の差がないときの)標本平均の差がこの値からこの値までの間になるであろうという範囲が得られるのです。
勘違いしないで欲しい点は「母平均の差が存在する範囲」を調べているわけではないということです。
この回答への補足
早速の御回答ありがとうございました。
御指摘のとおり「平均の存在する範囲」という書き方は問題がありますね。
quaestio様の「大雑把な説明」と断っている説明は,大変よく理解できますし,少なくとも母平均の差が存在する範囲ではないことは理解できます。
さて,一標本の平均の検定と独立な二標本の平均の差の検定に関して追加質問です。
1 エクセルでTTEST関数が準備されていますが,(1)一対の標本による平均の検定 (2)等分散の場合の2標本の平均の検定 (3)等分散でない場合の2標本の平均の検定 が選べます。例題で行っているのは,(1)をTTEST関数を使わずに行っていると考えてよろしいでしょうか。
2 (2)の等分散の場合の2標本の平均の検定を例題のような手順で行うとするとどのような手順になるのでしょうか。
素人質問で恐縮ですが,題意をくみ取っていただき御回答をよろしくお願いいたします。
No.3
- 回答日時:
1 です。
>私が参考にしているエクセルを使った統計の本に書いてある手順(手続き)を順に行えるという意味で書きました
そのエクセルを使った統計の本 以外になにか統計の本を読んでから質問した方がよいと思いますが。
他の方への追加質問にしてもそうです。
やさしそうな、統計の何も書いてない本だけを読んで、それで分からないのは当然です。それで素人質問とかいわれて
他の人に説明してもらうのはどうかと思います。
No.4
- 回答日時:
ANo.2で恥ずかしい間違いを発見しましたので訂正
> 「独立な二標本の平均の差の検定」(Paired t test)
「独立な二標本の平均の差の検定」(Two independent samples t test)
です。
この回答への補足
何度も御回答いただきありがとうございました。
1の方からは御指摘いただいておりますが,わたしなりに統計に関する書籍は何冊か読んでおります。ただ,表現の違いや数式の導き方の違いでよく分からなくなってしまっています。
実は,とある本にこのような例題を見付けました。
10年前の小学3年生の平均身長は143.5 標準偏差7.8の正規分布にしたがう。
現在の小学3年生10人の平均身長149.2 信頼区間95%で有意差があるかどうか。
143.5-1.96×SQRT(7.8の自乗/10)~143.5+SQRT(7.8の自乗/10)
149.2はこの範囲に入らないから有意差あり が回答になっています。
最初の質問に戻るのですが,最初に質問したときは改良前は平均のみ 改良後は平均と標準偏差が与えられております。
今回は,10年前が平均と標準偏差 現在が平均のみとなっております。
わたしが疑問に思っているのは,例えば今回のケースでも現在の平均と標準偏差は求まるわけで,10年前を基準に現在を比較するのか,現在を基準に10年前を比較するのか分からないのです。分かっていただけるでしょうか。
No.5
- 回答日時:
1 です
どちらも(質問の例と4のコメントの例)、母集団1つです。 前者は平均が既知、後者は平均と分散(標準偏差の二乗)が既知
それで、標本の従う確率分布が母集団の従う確率分布と同じかを知りたい。(確率分布は正規分布だと仮定しているので、平均と分散で確率分布は決まる、それと、分散は一致していると仮定しているので、問題にしているのは 平均が等しいかのみ)
ここで注意して欲しいのは、前者つまり質問のケースは、分散つまり標準偏差はわかっているけど、後者(4のコメントのケース)は分散つまり標準偏差はわかっていません。分布の分散と サンプルで求めた標準偏差は別物です。これは平均も同様です。
だから、問題は、サンプルとっている、つまり標本の従う確率分布が 母集団の確率分布の平均に等しいか? という問題で、標準偏差が与えられてる場合は、4のコメントのケース(つまり母集団の標準偏差に等しい)で、最初の質問のケースはサンプルから求めた標準偏差しかない(これは、不偏分散のルート)つまり代用品です。
ここでどちらも 標本の従う確率分布の平均が 母集団の従う確率分布の平均と等しいと仮定して
サンプルの平均値が従う確率分布を求めます。4のケースは 正規化つまり Z変換できます。従って、正規分布に従います。
質問のケースは 不偏分散なのでZ変換もどきで、この場合t分布に従っています。
従って 4のケースは Z検定 http://ja.wikipedia.org/wiki/Z%E6%A4%9C%E5%AE%9A
質問のケースは 1群のt検定 http://ja.wikipedia.org/wiki/Z%E6%A4%9C%E5%AE%9A
になります。 検定として全く別物です。
No.6
- 回答日時:
>ここで注意して欲しいのは、前者つまり質問のケースは、分散つまり標準偏差は
>わかっているけど、後者(4のコメントのケース)は分散つまり標準偏差はわかっ
>ていません
逆でした 4のケースはわかっていて、 質問のケースがわかってない でした
この回答への補足
何度も御回答頂きありがとうございました。(夜中にもかかわらずありがとうございます。)
質問のケースと4のケースでは検定が違うというのは理解しました。(私の本でも違う場所に書いてありました。)
さて,その上で質問なのですが
実は何冊も本を読み比べているのですが,
変化前の平均値と標本標準偏差
変化後の平均値と標本標準偏差
この2つの差から差の信頼区間を計算し,判定するという例題が載っている本があります。(この方法が一番納得できるので普段これを使っています。)
ただ,本によっては前を基準にするのか後を基準にするのか様々あり混乱しています。(もちろん私の読み取り不足が原因ですが・・・)
回答者の方から,変化後の標本標準偏差から不偏分散(母集団の分散推定値)を算出するのは代用品とあります。
もし仮に,変化前の平均と標準偏差 変化後の平均と標準偏差 どちらも正規分布という仮定がある場合
変化前の平均±1.96×変化前の標準偏差から求めた不偏標準偏差/変化前のサンプル数の平方根で信頼区間を算出し,変化後がこの信頼区間に収まるかどうかを判定するという方法は妥当でしょうか。
(私の持っている本では,変化後に関して信頼区間を出し,変化前が収まるかどうかを判定している本の例の方が多く掲載されています。)
御見解をいただけたら幸いです。
No.7
- 回答日時:
なんども言いますが、ちゃんとした統計の本を読んでください。
例えば、
数理統計学 (数学シリーズ)
稲垣 宣生 著 裳華房
とか、
そこで、前にも言いましたが 確率分布 とか 確率変数について しっかり勉強してください。
確率変数 X が N(μ,σ)に従うことと、 正規分布 N(μ,σ) に従う 互いに独立な 確率変数 X_1,... X_n
の平均 (X_1 + X_2 + ... +X_n)/n (=a とおきます) と 標準偏差
(((X_1 -a)^2 + (X2 -a)^2 +...+ (X_n-a)^2)/n-1)^(1/2) (この二つも 確率変数です)
(具体的なサンプルの値は、この確率変数がたまたまとった値です。それで導かれる、平均や標準偏差は、たまたま 上記の二つの確率変数がとった値です、 これらは N(μ,σ/n)(←これでよかったはず) の正規分布に従っています)
を混同しないように。 この概念を混同されているのが原因です。そこに気づくには、上記のようなちゃんとした統計の本を読まないと、分かりません。
本の紹介をありがとうございます。
笑われるかもしれませんが,何がちゃんとした本で何がちゃんとした本でないかも分かっていません。しかし,独学での勉強というのは時に「そもそも読む本が分からない」ところからスタートするものだと考えています。「インターネットで質問して適当に・・・」という気持ちはございません。今回の質問を通して,読むとよい本を知ることができたことだけでも私にとっては収穫でした。
No.8
- 回答日時:
訂正
N(μ,σ/n) にしたがうのは 平均 (X_1 + X_2 + ... +X_n)/n
(((X_1 -a)^2 + (X2 -a)^2 +...+ (X_n-a)^2)/n-1)^(1/2) は別の確率分布に従います。 カイ2乗分布あたりだったか(適当ですいません) ただよく分かっている分布です。 だから 検定が行えるわけです。
No.10
- 回答日時:
なるほど、前と後で平均と標準偏差が分かっているとき、二標本の平均の差の検定か一標本の平均の検定のどちらを使えばいいのか分からないということですね。
#1さんに指摘されてましたが、その平均と標準偏差が標本のものなのか母集団のものなのか、どちらなのか区別をつけることが重要です。
それによって、使うべき検定が決まります。
例えば、前の平均と標準偏差が十分な数のデータで求めたものであれば、母集団のそれらと同じとみなして、一標本の平均の検定を行っても問題ないでしょう。
そうでなければ、二標本の平均の差の検定を行うことになります。
(幾つあれば十分なのかは一概に言えません)
ANo.7, 8
> N(μ,σ/n)
N(平均,標準偏差)の場合N(μ,σ/√n)が正しく、N(平均,分散)の場合N(μ,σ^2/n)が正しい。
後者の書き方が一般的だと思います。
お二人の方,本当にありがとうございます。
標本のものなのか母集団と見なしてよいのかが重要であることが非常によく分かりました。
私がもっている本によると,改良前1500というのは,これまでずっと平均1500(これは母集団と見なすという仮定にほかならないと思います。) 改良を加えたら平均値が変化した。(改良後は標本集団ですね。) 改良後の標本集団は改良前の母集団と同じと見てよいかいけないかという判断をしているのですね。
統計ではいくつかの仮定が置かれていますが,この仮定が重要であることが分かりました。(素人ですのでつい,計算手順に目がいってしまいます。)
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 生物統計学の質問 7 2022/05/17 13:59
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 以下の問題が分からないので計算式を教えてください ある企業が製造している電球の寿命の母平均と,母標準 3 2023/01/14 00:43
- 統計学 誰か教えてください! 3 2022/07/01 23:02
- 統計学 この問題の答えとやり方を教えてください、(分布表などは調べてほしいです、) 2 2022/07/02 12:43
- 統計学 統計学についての質問です。 2標本問題で A: サイズ32 平均62.2 標準偏差11.0 B: サ 2 2023/02/08 14:15
- 統計学 統計学の問題です。よろしくお願いします。 ある部品の重量は正規分布に従うとされており,過去の経験から 1 2023/01/19 03:36
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 統計学の質問【帰無仮説】 大学で、現在の在籍者の平均通学時間が60分であるという帰無仮説を、それが6 8 2023/05/23 20:56
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
平均値と中庸値の違い
-
数学Bの「統計的な推測」の【復...
-
エクセル STDEVとSTDEVPの違い
-
これは令和四年の平均身長なの...
-
またまた質問です。 平均2.210 ...
-
信頼区間についての質問です。
-
母分散と標本分散の違い
-
標準平均Xバーの標準偏差について
-
母標準偏差・標本標準偏差と標...
-
相関係数0.876 0.991 危険率...
-
切断された正規分布
-
母集団分布を平均 μ, 分散 σ2 ...
-
カニの標本
-
標本平均、分散、期待値・・・...
-
「平均の2倍 - 最小値」とは?
-
平均の加法性とは
-
高校数学の統計 非復元抽出での...
-
大数の法則と中心極限定理の違...
-
かにの標本の作り方
-
信頼区間とt検定
おすすめ情報