とある書籍にて以下のことを学習しました。
・層化比例無作為抽出法を用いて標本抽出をおこなった場合、標準誤差の算出には標本全体の分散ではなく、各層内分散の加重平均値を用いる。
・よって、単純無作為抽出時に比較して標本誤差を低く抑えることができる(ことが多い)。
ここで質問なのですが・・・、
・層化比例無作為抽出をおこなう場合、すべてのな区間推定や検定,果ては分析仮定で標準誤差を用いるすべての多変量解析において、一般的な統計ソフトを用いることは『正しくない』のでしょうか(大抵の統計ソフトは単純無作為抽出を仮定していると考えています)?
・『正しくない』とすれば、皆さんはどのように対処されてらっさるのでしょうか?ご自身でスクリプトを書いたりされているのでしょうか?それとも、「分析結果にさほど影響を与えるものでもないから統計ソフトで済ましている」といった感じなのでしょうか?
以上、どなたかおわかりの方がいらっしゃいましたら、ご教授いただけませんでしょうか?
宜しくお願いいたします。
No.2ベストアンサー
- 回答日時:
理論的には分かっていても、時間、金、精神エネルギーなどのコストの関係で、現実に使える手段は限られるということでしょうか。
層化比例無作為抽出(したがって復元倍率を使わないか、またはすべての客体に同一の復元倍率を乗じる)に限れば、単純無作為抽出より必ず達成精度が高くなります。したがって、これをあたかも単純無作為抽出のようにみなして誤差を計算すると、必ず過大推計になります。誤差を安全弁としてみると、過少推計すれば差し障りが大きいけど、過大推計する分には差し障りが少ない、という意味で、単純無作為抽出のようにみなして計算することを正当化できるかもしれません。ただ、レポートにまとめるときは、そういう方法をとったことを明記するのが良心的でしょう。
この回答への補足
私の知りたかったことへのドンピシャのご回答をいただきました。
有難うございます。
非常に参考になります。
で、よろしければもうひとつだけ質問にお付き合いいただいてよろしいですか?
>層化比例無作為抽出(したがって復元倍率を使わないか、またはすべての客体に同一の復元倍率を乗じる)に限れば、単純無作為抽出より必ず達成精度が高くなります。
巷の学習書などでは、この点について「だからとりあえずは層化比例無作為抽出をしたらいいよ」という趣旨が展開されていることが多いように感じるのですが、もし単純無作為抽出と層化比例無作為抽出のどちらも可能な状況であれば単純無作為抽出のほうを用いるべき調査主題というのもあるのではないかと考えるのですがいかがでしょう?
例えば、『利き腕(地域別の有意差はないと仮定)』の調査に居住地域を層化基準として層化比例単純無作為抽出をおこない、その結果得たサンプルデータについて、抽出法に応じた誤差推定をおこなった場合、本来の誤差の一部を層間誤差として取り除いた不正に過小評価された誤差をはじき出してしまうように思います。
No.1
- 回答日時:
ご質問の趣旨に合っているか自信がありませんけど…
1 層化抽出の場合の標準誤差などを、単純無作為抽出を前提とした手法で推計するのは、もちろん、間違いです。
2 しっかりした統計調査なら、層化抽出を前提とした手法で標準誤差を推計していますし、また、その推計方法を公開しています。代表的な方法として、
(1)層別に標準誤差を推計したうえで、それらのウェイト付けされた総和でもって、全体の標準誤差を計算する、
(2)(副標本による方法)サンプルをいくつかのグループに分けて集計して、そのグループごとの結果の散らばりから、全体の標準誤差を推計する、
といったものがあります。例えば、失業率なら、次のURLに解説があります。
http://www.stat.go.jp/data/roudou/9.htm
3 2つの調査の結果が違っているかどうかを検定するために、カイ2乗検定の一種のワルド検定を使う方法もあります。
http://www.jil.go.jp/institute/discussion/2005/0 …
4 市販の統計ソフトにも、層化抽出に対応したものがあるようです(私は使ったことがありませんが)。
http://www.spss.co.jp/software/pasw_cs/index.html
この回答への補足
つたない質問にご回答いただき有難うございます。
1,2:
そうですね。このあたりのことについては、何とか理解できていると思います。
ただ、同じ層化抽出でもネイマン配分による層化であったり、リンク先のような複雑な多段抽出であれば
様々な推定方法について明記されていることもあるかと思いますが、『層化比例無作為抽出』の場合ですと母数の推定値は単純無作為抽出の場合と一致し、推定誤差の違いが問題になってくると認識しておりますので、現実に統計をお使いになっている方は「まあ、いろいろ細かいことをやるくらいなら誤差くらいはいいだろう」と考え単純無作為抽出を仮定した誤差推定をおこなうことが多いのだろうか、またそれが一般的であるといえるのだろうかと、そのように考え質問させていただいた次第です。
いかがなものでしょうか?
3:
はい。今回悩んでる中で私もこのリンクは確認しました。
これは私にとってひとつの解決策ではあるのですが、例えば分散分析や多変量解析など、より汎用性のある手段を探しています(そんなのないような気もしますが・・・)。
4:
3と同様です。
私にとっては『富士の高嶺に降る雪』ってやつですね。
ただ、詳細をみてみると、ワルド検定が多用されているようですので、逆説的に考えると、通常は皆さん層化比例無作為抽出時は単純無作為抽出を仮定した方法で分析しているのかな、と感じました。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 不偏分散について 3 2022/03/29 15:57
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 統計学 統計学の質問【帰無仮説】 大学で、現在の在籍者の平均通学時間が60分であるという帰無仮説を、それが6 8 2023/05/23 20:56
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 統計学の質問【帰無仮説】 高校の新学習指導要領では、統計的仮説検定の基本的な考え方が必修単元となった 5 2023/05/23 21:00
- 統計学 統計学の問題です。どうか教えてください。 線形回帰モデルYi=β0+β1xi+ui(i=1,2,.. 5 2023/06/16 00:51
- 統計学 統計学の質問【帰無仮説】 W大学のP学部において、自宅通学者の比率にについて調べたい。 P学部から1 8 2023/05/25 23:28
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
おすすめ情報
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
平均値と中庸値の違い
-
数学Bの「統計的な推測」の【復...
-
エクセル STDEVとSTDEVPの違い
-
これは令和四年の平均身長なの...
-
またまた質問です。 平均2.210 ...
-
信頼区間についての質問です。
-
母分散と標本分散の違い
-
標準平均Xバーの標準偏差について
-
母標準偏差・標本標準偏差と標...
-
相関係数0.876 0.991 危険率...
-
切断された正規分布
-
母集団分布を平均 μ, 分散 σ2 ...
-
カニの標本
-
標本平均、分散、期待値・・・...
-
「平均の2倍 - 最小値」とは?
-
平均の加法性とは
-
高校数学の統計 非復元抽出での...
-
大数の法則と中心極限定理の違...
-
かにの標本の作り方
-
信頼区間とt検定
おすすめ情報