プロが教えるわが家の防犯対策術!

現在、統計を勉強しています。
そこでt分布についてグラフ化して理解を深めようとしているのですが
実際に母集団から得られたデータ(標本)で標本平均、標本標準偏差、自由度から
t分布をベースにした分布図を作成したいと思っているのですが作成方法が分かりません。

平均0とした場合のt分布の作成はネットでいくつか見つけたのですが標本から作成する手順が
分かっておりません。

やりたいこととしては自由度が変わることによって標本平均からどのくらい信頼区間が離れていくかを
グラフにして確認できるようにしたいと思っております。

説明が下手で申し訳ございません。
ご教授いただければと思います。

「【統計】標本平均、標本標準偏差からt分布」の質問画像

A 回答 (9件)

お礼、ありがとうございます。



> どのくらいのサンプル数によって平均と標準偏差が母集団へ収束するのか気になっておりExcelでシミュレーションしておりました。

私も、今回のご質問を機に、実サンプルの変換によってt分布に従う分布形が得られるのか、チャレンジすることができました。

その結果は、「t分布は正規分布とは違いすそ野が広い」という分布形の違いが分かるためには、相当数のデータが無いとダメだということを知りました。

ひるがえって、分散に母集団のものとは違う推定値を使って基準化したサンプルは「t分布に従う」ということを発見したスチューデントというかゴセット先生はすごいんだなあ、ということが実感できました。
数個のサンプルの変換値では、それがt分布になるのか分かる訳がないからです。

実際に手を動かすことによって、私も良い勉強になりました。やっぱり耳学問はダメですね(最初のうろ覚えのいい加減回答の反省です)。
    • good
    • 1

すみません。

#7を訂正させて下さい。

x/(σ/√n) → x/σ です。カイ2乗値をφで割って分散にしているのですね。その平方根なのでσです。

いずれにしろ、#7の方法でt分布のヒストグラム(分布形)は作れます。
    • good
    • 1

作図方法を説明します。



正規分布に従う標本があるとします。平均は任意です。分散は1にする必要があります。

〇、〇、〇、〇、・・・・

これに、乱数で、任意の自由度φのカイ2乗分布に従う分散を対応させます。カイ2乗乱数というヤツです。〇とは独立に作る必要があります。

●、●、●、●、・・・・

この各セットに対し、〇/√(●/φ)を計算します。これをヒストグラム化すれば、標本〇に対応する自由度φのt分布の形が得られます。
これは、x/(σ/√n) の意味があります。

〇の分散を1にするのは、●が分散1に対応するので、〇/√(●/φ)が本来の基準化 x/(σ/√n) の役割を果たすようにするため、分子側で調整するのです。

実際に得られた標本の分布ってヒストグラム化しても何分布かはっきりしないように、たかだか数十個の標本では、変換してもはっきりしません。
私は〇を正規乱数で10万個作りました。それでやっとそれらしい形が出来ました。

やっぱり、理論式で曲線を作るしかないと思います。
    • good
    • 1

実際のサンプルから95%信頼区間を求めるには、10万点あれば、ソートして上下から2500番目の点の値を求めれば良いですね。



実際のサンプルからやるのは、計算機が無いと大変ですね。

理論式からであれば、ご質問の図や、各自由度におけるパーセント点は、Rなどの統計ソフトによって簡単にできます。でも、それは調査済みなのですよね。
    • good
    • 1
この回答へのお礼

返信遅くなり申し訳ございません。
回答ありがとうございます。

色々調べていただきありがとうございます。

 ≫たかだか数百点では、平均値も安定しませんし、正規分布かt分布かの見分けすらつきませんでした。
 → はい!私もどのくらいのサンプル数によって平均と標準偏差が母集団へ収束するのか気になっておりExcelでシミュレーションしておりました。
 これを可視化することによって他の方も普段収集しているサンプル数がどのくらい信頼できるのか確認できればと思っておりました。
 (私の場合は100サンプルくらいまでしか計算してないので10万点はすごいです…)

仕事で統計のことを相談できる方がおらず、自分よがりになっていないか不安な部分もあったので助かります。
ありがとうございます。

お礼日時:2022/10/20 00:06

その後調べた結果、分散は基準化されるので、1から変更することはできませんでした。



また、理論曲線ではなく、サンプルから描いてみることに挑戦したのですが、滑らかな線にするには10万点くらい正規乱数を発生させないとできませんでした。

添付図はRで作成しました。

〇のプロットは標準正規分布
赤・・・φ=5のt分布
青・・・φ=5、μ=2の非心t分布
緑・・・φ=5、μ=4の非心t分布

10万点の観測点でヒストグラムを作成していますが、まだギザギザです。

たかだか数百点では、平均値も安定しませんし、正規分布かt分布かの見分けすらつきませんでした。
「【統計】標本平均、標本標準偏差からt分布」の回答画像5
    • good
    • 1

うろ覚えで回答してはダメですね。

Wikiを調べていて、さらなる間違いに気づきました。

再び訂正させて下さい。正しくは以下です。本当にすみません。「」内を忘れていました。Wikiを見て思い出しました。

~~~~~~~~~~~~~~~~~~~~~~~~

t分布は、標準正規分布Zと、自由度φのカイ2乗分布Vを「自由度φで基準化した」値の平方根との比

t=Z/√(V/φ)

です。

よって、非心化したものの式も、

t=(Z+μ)/√(V/φ)

に訂正します。これがWikiに出ていました。Wikiは自由度はνになっています。

うろ覚えで回答してしまったことをお詫びします。お恥ずかしい。
    • good
    • 1

訂正があります。

「」内です。すみません。

~~~~~~~~~~~~~~~~~~~~~~~~

t分布は、標準正規分布Zと自由度φのカイ2乗分布「Vの平方根」の比

t=Z/√V
    • good
    • 1

t分布は、一般に誤差分布の検定を行うための枠組みですから、期待値=0を想定しています。

誤差は不偏(偏らない)という仮定があるからです。

しかし、ご質問者のように、標本平均μが動いたら(=偏ったら)どうなるか、と興味を持たれる場合もあると思います。

そのように拡張したt分布が、「非心t分布」です。非心化すると左右非対称になります。

t分布は、標準正規分布Zと自由度φのカイ2乗分布の比

t=Z/√V

ですが、(Z+μ)/√V となるのが、非心t分布です。

さらに標準偏差は分母側で変えることが出来たと思います。詳しくはWikiとか専門書を引いて下さいませ。
    • good
    • 1

t分布のグラフを自分で書いてみようという意欲は大変大事ですが、統計の処理では「t分布表」で「信頼区間」を求めるための「上側、下側の判定値」を読み取ることで十分です。



ちなみに、t分布は「理論的な分布」であって、サンプルデータから作るものではありません。「サンプルから得られたデータはこの分布に従うはずだ」という分布ですから。
確率分布関数は下記などに載っています。

https://ja.wikipedia.org/wiki/T%E5%88%86%E5%B8%83
https://mi-chan-nel.com/probability-density-func …
https://www.hello-statisticians.com/explain-term …
    • good
    • 1
この回答へのお礼

お礼遅くなり申し訳ございません。
回答ありがとうございます。

 ≫≫t分布のグラフを自分で書いてみようという意欲は大変大事ですが、統計の処理では「t分布表」で「信頼区間」を求めるための「上側、下側の判定値」を読み取ることで十分です。
 → 実際にt検定で計算して使ってはいるものの標本数によってどれだけ信頼区間から外れていくのかを可視化出来たら他の人も直感的に理解できる物が出来るのかと思っておりました。(自分がt検定の内容を忘れるのもあるのですが…)

 ≫≫ちなみに、t分布は「理論的な分布」であって、サンプルデータから作るものではありません。「サンプルから得られたデータはこの分布に従うはずだ」という分布ですから。
 → そうだったんですね、
   実際に仕事でサンプル(標本)を取るとき10以下と少なく(これが問題なのですが…)
   またサンプルは30くらいは必要とされている理由をt分布を使って可視化することによって他の人にもどのくらいで正規分布に近づいている様子が分かればと思っておりました。

普段、仕事では統計で相談できる方がおらず教えていただきありがとうございます。

お礼日時:2022/10/19 23:56

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!