アプリ版:「スタンプのみでお礼する」機能のリリースについて

統計について知識のないものからの質問です。

サハラ砂漠には様々な古墳がありますが、その中で「鍵穴型円墳」が約1000基あります。その内7基の年代測定をしたところすべて紀元前3000年前後に集中しています(CalBC3340-3030~CalBC2910-2700の範囲)。 

この結果を受けて、「この形式の古墳は紀元前3000年前後のもの」と断定してよいものでしょうか。母数に対してサンプル数が少なすぎないでしょうか。 結果の妥当性はどのように考えれば良いのでしょうか。 

別の方の質問への回答で、「正規分布でない場合は最低6-8サンプル必要」との説明を見つけましたが、このサンプル数での妥当性はどのように考えるべきでしょうか。

よろしくお願い致します。(素人の考古学愛好者からの質問)

A 回答 (1件)

 ホントに断定するには全数調査が必要で、ひとつでも例外が見つかったらアウト、というのが、考古学で普通に言う意味での「断定」(年代決定の指標として使える)ってことではないかしらん。


 ところで、「紀元前3000年前後」の「前後」というところが600年も幅がある。(逆に言えば「紀元前3000年前後ではない」という表現は一体どういう意味なのか)そこがどのぐらいユルい概念であるかによって、話がずいぶん変わりそうな気もします。
 また、「正規分布を仮定する」なんてのは、よほどの根拠でもない限り採用できないしょう。で、1000個中7つしか調べてないような段階では、たいした根拠なんざ、ある筈もなかろうと思うんですけどね。

 …という注意点を一応気に留めた上で考えてみましょ。

 まず、「紀元前3000年前後である」というのが、ま、なんらか「厳密な性質」なのだと思って、これをHと書く事にします。そして、「ランダムに取ったサンプルがHである確率」をpとしましょう。で、観測事実X:「ランダムに取ったn個のサンプルはどれも性質Hを満たすものだった」から、pを推定しろ、という風に考える。(ただ、本当にランダム調査なのかどうかは、ご質問からは分からない。もし近場のやつをまとめて調べたりしてたら、ランダムとはとても言えない。が、ま、ま、それはさておき。)
 たとえばp=0.65だとすると、p^7≒0.05です。つまり、実は墳墓の65%だけがHを満たす、という状況で、調べた7例が偶然全部Hを満たすということが生じる確率は5%ある。この時に言える推定は、ですから「有意水準5%で、p>0.65だ」ということです。言い換えれば「多分、鍵穴型円墳の2/3ぐらいがHを満たす」という話ですから、これでは仰るところの「断定」にはほど遠い。

 そこで、有意水準5%で p>0.9 となるnを計算すると、 n≧29。
 つまり、「29個のサンプルがどれもHだった」という観測があったとする。その場合、「鍵穴型円墳の90%以上がHを満たす」と言ったとき、それが間違っている確率は5%以下である。このぐらいになると、ちょっと「断定」っぽくなってきます。(サンプルがランダムでない場合には、間違っている確率はもっと大きくなります。)
    • good
    • 0
この回答へのお礼

分かりやすいご説明ありがとうございます。 やはりサンプル数が少なすぎるようですね。

お礼日時:2014/03/09 00:31

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!