現在、統計を勉強しています。
そこでt分布についてグラフ化して理解を深めようとしているのですが
実際に母集団から得られたデータ(標本)で標本平均、標本標準偏差、自由度から
t分布をベースにした分布図を作成したいと思っているのですが作成方法が分かりません。
平均0とした場合のt分布の作成はネットでいくつか見つけたのですが標本から作成する手順が
分かっておりません。
やりたいこととしては自由度が変わることによって標本平均からどのくらい信頼区間が離れていくかを
グラフにして確認できるようにしたいと思っております。
説明が下手で申し訳ございません。
ご教授いただければと思います。
A 回答 (9件)
- 最新から表示
- 回答順に表示
No.9
- 回答日時:
お礼、ありがとうございます。
> どのくらいのサンプル数によって平均と標準偏差が母集団へ収束するのか気になっておりExcelでシミュレーションしておりました。
私も、今回のご質問を機に、実サンプルの変換によってt分布に従う分布形が得られるのか、チャレンジすることができました。
その結果は、「t分布は正規分布とは違いすそ野が広い」という分布形の違いが分かるためには、相当数のデータが無いとダメだということを知りました。
ひるがえって、分散に母集団のものとは違う推定値を使って基準化したサンプルは「t分布に従う」ということを発見したスチューデントというかゴセット先生はすごいんだなあ、ということが実感できました。
数個のサンプルの変換値では、それがt分布になるのか分かる訳がないからです。
実際に手を動かすことによって、私も良い勉強になりました。やっぱり耳学問はダメですね(最初のうろ覚えのいい加減回答の反省です)。
No.8
- 回答日時:
すみません。
#7を訂正させて下さい。x/(σ/√n) → x/σ です。カイ2乗値をφで割って分散にしているのですね。その平方根なのでσです。
いずれにしろ、#7の方法でt分布のヒストグラム(分布形)は作れます。
No.7
- 回答日時:
作図方法を説明します。
正規分布に従う標本があるとします。平均は任意です。分散は1にする必要があります。
〇、〇、〇、〇、・・・・
これに、乱数で、任意の自由度φのカイ2乗分布に従う分散を対応させます。カイ2乗乱数というヤツです。〇とは独立に作る必要があります。
●、●、●、●、・・・・
この各セットに対し、〇/√(●/φ)を計算します。これをヒストグラム化すれば、標本〇に対応する自由度φのt分布の形が得られます。
これは、x/(σ/√n) の意味があります。
〇の分散を1にするのは、●が分散1に対応するので、〇/√(●/φ)が本来の基準化 x/(σ/√n) の役割を果たすようにするため、分子側で調整するのです。
実際に得られた標本の分布ってヒストグラム化しても何分布かはっきりしないように、たかだか数十個の標本では、変換してもはっきりしません。
私は〇を正規乱数で10万個作りました。それでやっとそれらしい形が出来ました。
やっぱり、理論式で曲線を作るしかないと思います。
No.6
- 回答日時:
実際のサンプルから95%信頼区間を求めるには、10万点あれば、ソートして上下から2500番目の点の値を求めれば良いですね。
実際のサンプルからやるのは、計算機が無いと大変ですね。
理論式からであれば、ご質問の図や、各自由度におけるパーセント点は、Rなどの統計ソフトによって簡単にできます。でも、それは調査済みなのですよね。
返信遅くなり申し訳ございません。
回答ありがとうございます。
色々調べていただきありがとうございます。
≫たかだか数百点では、平均値も安定しませんし、正規分布かt分布かの見分けすらつきませんでした。
→ はい!私もどのくらいのサンプル数によって平均と標準偏差が母集団へ収束するのか気になっておりExcelでシミュレーションしておりました。
これを可視化することによって他の方も普段収集しているサンプル数がどのくらい信頼できるのか確認できればと思っておりました。
(私の場合は100サンプルくらいまでしか計算してないので10万点はすごいです…)
仕事で統計のことを相談できる方がおらず、自分よがりになっていないか不安な部分もあったので助かります。
ありがとうございます。
No.5
- 回答日時:
その後調べた結果、分散は基準化されるので、1から変更することはできませんでした。
また、理論曲線ではなく、サンプルから描いてみることに挑戦したのですが、滑らかな線にするには10万点くらい正規乱数を発生させないとできませんでした。
添付図はRで作成しました。
〇のプロットは標準正規分布
赤・・・φ=5のt分布
青・・・φ=5、μ=2の非心t分布
緑・・・φ=5、μ=4の非心t分布
10万点の観測点でヒストグラムを作成していますが、まだギザギザです。
たかだか数百点では、平均値も安定しませんし、正規分布かt分布かの見分けすらつきませんでした。
No.4
- 回答日時:
うろ覚えで回答してはダメですね。
Wikiを調べていて、さらなる間違いに気づきました。再び訂正させて下さい。正しくは以下です。本当にすみません。「」内を忘れていました。Wikiを見て思い出しました。
~~~~~~~~~~~~~~~~~~~~~~~~
t分布は、標準正規分布Zと、自由度φのカイ2乗分布Vを「自由度φで基準化した」値の平方根との比
t=Z/√(V/φ)
です。
よって、非心化したものの式も、
t=(Z+μ)/√(V/φ)
に訂正します。これがWikiに出ていました。Wikiは自由度はνになっています。
うろ覚えで回答してしまったことをお詫びします。お恥ずかしい。
No.3
- 回答日時:
訂正があります。
「」内です。すみません。~~~~~~~~~~~~~~~~~~~~~~~~
t分布は、標準正規分布Zと自由度φのカイ2乗分布「Vの平方根」の比
t=Z/√V
No.2
- 回答日時:
t分布は、一般に誤差分布の検定を行うための枠組みですから、期待値=0を想定しています。
誤差は不偏(偏らない)という仮定があるからです。しかし、ご質問者のように、標本平均μが動いたら(=偏ったら)どうなるか、と興味を持たれる場合もあると思います。
そのように拡張したt分布が、「非心t分布」です。非心化すると左右非対称になります。
t分布は、標準正規分布Zと自由度φのカイ2乗分布の比
t=Z/√V
ですが、(Z+μ)/√V となるのが、非心t分布です。
さらに標準偏差は分母側で変えることが出来たと思います。詳しくはWikiとか専門書を引いて下さいませ。
No.1
- 回答日時:
t分布のグラフを自分で書いてみようという意欲は大変大事ですが、統計の処理では「t分布表」で「信頼区間」を求めるための「上側、下側の判定値」を読み取ることで十分です。
ちなみに、t分布は「理論的な分布」であって、サンプルデータから作るものではありません。「サンプルから得られたデータはこの分布に従うはずだ」という分布ですから。
確率分布関数は下記などに載っています。
↓
https://ja.wikipedia.org/wiki/T%E5%88%86%E5%B8%83
https://mi-chan-nel.com/probability-density-func …
https://www.hello-statisticians.com/explain-term …
お礼遅くなり申し訳ございません。
回答ありがとうございます。
≫≫t分布のグラフを自分で書いてみようという意欲は大変大事ですが、統計の処理では「t分布表」で「信頼区間」を求めるための「上側、下側の判定値」を読み取ることで十分です。
→ 実際にt検定で計算して使ってはいるものの標本数によってどれだけ信頼区間から外れていくのかを可視化出来たら他の人も直感的に理解できる物が出来るのかと思っておりました。(自分がt検定の内容を忘れるのもあるのですが…)
≫≫ちなみに、t分布は「理論的な分布」であって、サンプルデータから作るものではありません。「サンプルから得られたデータはこの分布に従うはずだ」という分布ですから。
→ そうだったんですね、
実際に仕事でサンプル(標本)を取るとき10以下と少なく(これが問題なのですが…)
またサンプルは30くらいは必要とされている理由をt分布を使って可視化することによって他の人にもどのくらいで正規分布に近づいている様子が分かればと思っておりました。
普段、仕事では統計で相談できる方がおらず教えていただきありがとうございます。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 信頼区間についての質問です。 6 2023/06/25 17:34
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 統計学についての質問です。 2標本問題で A: サイズ32 平均62.2 標準偏差11.0 B: サ 2 2023/02/08 14:15
- 統計学 ある集団の平均身長を調べたい. 集団全体を母集団とし, 母集団から無作為抽出した15人の平均身長が1 1 2023/02/03 15:26
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 統計学の質問【帰無仮説】 大学で、現在の在籍者の平均通学時間が60分であるという帰無仮説を、それが6 8 2023/05/23 20:56
- 統計学 Excelによるサンプルの拡大について 6 2023/08/22 16:03
- 統計学 不偏分散について 3 2022/03/29 15:57
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
溶解度の問題 理科
-
下の対数表示のグラフから低域...
-
検量線の決定係数について
-
心理機能診断をしたのですが、...
-
サンプル数の異なる2群間にお...
-
全商推薦について教えてください。
-
統計学の問題でわからないので...
-
統計 RSD%について教えて下さい。
-
グラフは横軸がすべり、縦軸が...
-
エクセルで正規分布かどうかを...
-
片対数グラフで…
-
エクセルのグラフから半値幅を...
-
データが正規分布しているか判...
-
統計学のサンプル数2000の根拠は?
-
パイロットサンプルって何ですか?
-
対応のあるt検定の結果の書き方
-
極値をもつ時と持たない時、単...
-
標準偏差の分母にルートをかけ...
-
aを実数の定数とする。二次関数...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
エクセルでランダム関数で乱数...
-
ブラック・ショールズ方程式を...
-
複数の集団の全体平均が0より有...
-
検量線の決定係数について
-
ポアソン回帰でのカウントデー...
-
青い下線部分はなぜそうなるの...
-
統計学の問題でわからないので...
-
[Excel] リストからの無作為抽出
-
x^2+y^2はどのような分布をする?
-
エクセルのグラフから半値幅を...
-
統計について
-
極値をもつ時と持たない時、単...
-
エクセルで正規分布かどうかを...
-
パイロットサンプルって何ですか?
-
データが正規分布しているか判...
-
回帰分析の回帰係数のt検定
-
正規分布について
おすすめ情報