プロが教える店舗&オフィスのセキュリティ対策術

とある書籍にて以下のことを学習しました。


・層化比例無作為抽出法を用いて標本抽出をおこなった場合、標準誤差の算出には標本全体の分散ではなく、各層内分散の加重平均値を用いる。

・よって、単純無作為抽出時に比較して標本誤差を低く抑えることができる(ことが多い)。


ここで質問なのですが・・・、


・層化比例無作為抽出をおこなう場合、すべてのな区間推定や検定,果ては分析仮定で標準誤差を用いるすべての多変量解析において、一般的な統計ソフトを用いることは『正しくない』のでしょうか(大抵の統計ソフトは単純無作為抽出を仮定していると考えています)?

・『正しくない』とすれば、皆さんはどのように対処されてらっさるのでしょうか?ご自身でスクリプトを書いたりされているのでしょうか?それとも、「分析結果にさほど影響を与えるものでもないから統計ソフトで済ましている」といった感じなのでしょうか?


以上、どなたかおわかりの方がいらっしゃいましたら、ご教授いただけませんでしょうか?
宜しくお願いいたします。

A 回答 (2件)

理論的には分かっていても、時間、金、精神エネルギーなどのコストの関係で、現実に使える手段は限られるということでしょうか。



層化比例無作為抽出(したがって復元倍率を使わないか、またはすべての客体に同一の復元倍率を乗じる)に限れば、単純無作為抽出より必ず達成精度が高くなります。したがって、これをあたかも単純無作為抽出のようにみなして誤差を計算すると、必ず過大推計になります。誤差を安全弁としてみると、過少推計すれば差し障りが大きいけど、過大推計する分には差し障りが少ない、という意味で、単純無作為抽出のようにみなして計算することを正当化できるかもしれません。ただ、レポートにまとめるときは、そういう方法をとったことを明記するのが良心的でしょう。

この回答への補足

私の知りたかったことへのドンピシャのご回答をいただきました。
有難うございます。
非常に参考になります。

で、よろしければもうひとつだけ質問にお付き合いいただいてよろしいですか?

>層化比例無作為抽出(したがって復元倍率を使わないか、またはすべての客体に同一の復元倍率を乗じる)に限れば、単純無作為抽出より必ず達成精度が高くなります。

巷の学習書などでは、この点について「だからとりあえずは層化比例無作為抽出をしたらいいよ」という趣旨が展開されていることが多いように感じるのですが、もし単純無作為抽出と層化比例無作為抽出のどちらも可能な状況であれば単純無作為抽出のほうを用いるべき調査主題というのもあるのではないかと考えるのですがいかがでしょう?
例えば、『利き腕(地域別の有意差はないと仮定)』の調査に居住地域を層化基準として層化比例単純無作為抽出をおこない、その結果得たサンプルデータについて、抽出法に応じた誤差推定をおこなった場合、本来の誤差の一部を層間誤差として取り除いた不正に過小評価された誤差をはじき出してしまうように思います。

補足日時:2011/02/11 10:03
    • good
    • 0

ご質問の趣旨に合っているか自信がありませんけど…



1 層化抽出の場合の標準誤差などを、単純無作為抽出を前提とした手法で推計するのは、もちろん、間違いです。

2 しっかりした統計調査なら、層化抽出を前提とした手法で標準誤差を推計していますし、また、その推計方法を公開しています。代表的な方法として、

(1)層別に標準誤差を推計したうえで、それらのウェイト付けされた総和でもって、全体の標準誤差を計算する、

(2)(副標本による方法)サンプルをいくつかのグループに分けて集計して、そのグループごとの結果の散らばりから、全体の標準誤差を推計する、

といったものがあります。例えば、失業率なら、次のURLに解説があります。

http://www.stat.go.jp/data/roudou/9.htm

3 2つの調査の結果が違っているかどうかを検定するために、カイ2乗検定の一種のワルド検定を使う方法もあります。

http://www.jil.go.jp/institute/discussion/2005/0 …

4 市販の統計ソフトにも、層化抽出に対応したものがあるようです(私は使ったことがありませんが)。

http://www.spss.co.jp/software/pasw_cs/index.html

この回答への補足

つたない質問にご回答いただき有難うございます。

1,2:
そうですね。このあたりのことについては、何とか理解できていると思います。
ただ、同じ層化抽出でもネイマン配分による層化であったり、リンク先のような複雑な多段抽出であれば
様々な推定方法について明記されていることもあるかと思いますが、『層化比例無作為抽出』の場合ですと母数の推定値は単純無作為抽出の場合と一致し、推定誤差の違いが問題になってくると認識しておりますので、現実に統計をお使いになっている方は「まあ、いろいろ細かいことをやるくらいなら誤差くらいはいいだろう」と考え単純無作為抽出を仮定した誤差推定をおこなうことが多いのだろうか、またそれが一般的であるといえるのだろうかと、そのように考え質問させていただいた次第です。
いかがなものでしょうか?

3:
はい。今回悩んでる中で私もこのリンクは確認しました。
これは私にとってひとつの解決策ではあるのですが、例えば分散分析や多変量解析など、より汎用性のある手段を探しています(そんなのないような気もしますが・・・)。

4:
3と同様です。
私にとっては『富士の高嶺に降る雪』ってやつですね。
ただ、詳細をみてみると、ワルド検定が多用されているようですので、逆説的に考えると、通常は皆さん層化比例無作為抽出時は単純無作為抽出を仮定した方法で分析しているのかな、と感じました。

補足日時:2011/02/10 20:54
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!