統計　考古学調査でのサンプル数と結果の妥当性

Question

統計について知識のないものからの質問です。

サハラ砂漠には様々な古墳がありますが、その中で「鍵穴型円墳」が約1000基あります。その内7基の年代測定をしたところすべて紀元前3000年前後に集中しています（CalBC3340-3030～CalBC2910-2700の範囲）。

この結果を受けて、「この形式の古墳は紀元前3000年前後のもの」と断定してよいものでしょうか。母数に対してサンプル数が少なすぎないでしょうか。　結果の妥当性はどのように考えれば良いのでしょうか。

別の方の質問への回答で、「正規分布でない場合は最低6－8サンプル必要」との説明を見つけましたが、このサンプル数での妥当性はどのように考えるべきでしょうか。

よろしくお願い致します。（素人の考古学愛好者からの質問）

stomachman · Accepted Answer

ホントに断定するには全数調査が必要で、ひとつでも例外が見つかったらアウト、というのが、考古学で普通に言う意味での「断定」（年代決定の指標として使える）ってことではないかしらん。
　ところで、「紀元前3000年前後」の「前後」というところが600年も幅がある。（逆に言えば「紀元前3000年前後ではない」という表現は一体どういう意味なのか）そこがどのぐらいユルい概念であるかによって、話がずいぶん変わりそうな気もします。
　また、「正規分布を仮定する」なんてのは、よほどの根拠でもない限り採用できないしょう。で、1000個中7つしか調べてないような段階では、たいした根拠なんざ、ある筈もなかろうと思うんですけどね。

…という注意点を一応気に留めた上で考えてみましょ。

まず、「紀元前3000年前後である」というのが、ま、なんらか「厳密な性質」なのだと思って、これをHと書く事にします。そして、「ランダムに取ったサンプルがHである確率」をpとしましょう。で、観測事実X：「ランダムに取ったn個のサンプルはどれも性質Hを満たすものだった」から、pを推定しろ、という風に考える。（ただ、本当にランダム調査なのかどうかは、ご質問からは分からない。もし近場のやつをまとめて調べたりしてたら、ランダムとはとても言えない。が、ま、ま、それはさておき。）
　たとえばp=0.65だとすると、p^7≒0.05です。つまり、実は墳墓の65%だけがHを満たす、という状況で、調べた7例が偶然全部Hを満たすということが生じる確率は5%ある。この時に言える推定は、ですから「有意水準5%で、p＞0.65だ」ということです。言い換えれば「多分、鍵穴型円墳の2/3ぐらいがHを満たす」という話ですから、これでは仰るところの「断定」にはほど遠い。

そこで、有意水準5%で p＞0.9 となるnを計算すると、 n≧29。
　つまり、「29個のサンプルがどれもHだった」という観測があったとする。その場合、「鍵穴型円墳の90%以上がHを満たす」と言ったとき、それが間違っている確率は5%以下である。このぐらいになると、ちょっと「断定」っぽくなってきます。（サンプルがランダムでない場合には、間違っている確率はもっと大きくなります。）

統計 考古学調査でのサンプル数と結果の妥当性

ホントに断定するには全数調査が必要で、ひとつでも例外が見つかったらアウト、というのが、考古学で普通に言う意味での「断定」（年代決定の指標として使える）ってことではないかしらん。

似たような質問が見つかりました

関連するカテゴリからQ&Aを探す

デイリーランキングこのカテゴリの人気デイリーQ&Aランキング

マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング

統計　考古学調査でのサンプル数と結果の妥当性

　ホントに断定するには全数調査が必要で、ひとつでも例外が見つかったらアウト、というのが、考古学で普通に言う意味での「断定」（年代決定の指標として使える）ってことではないかしらん。