dポイントプレゼントキャンペーン実施中!

統計の計算方法についてなのですが、たとえば度数分布表において以下のようになっていた時、

Aを持っている人の度数分布
3個以下 10人
4~8個 12人
8~12個 35人
12個以上 18人

平均を取りたい場合「~以下」「~以上」とされた度数は、
どのようにして結果に取り込めばいいのか分かりません。

もしかしたらAを持っている3個以下の人は全員が1個かもしれませんし3個かもしれませんので、
やはり、平均を取る際は無視して残りで平均を取るべきなのでしょうか?

よろしくお願いいたします。

A 回答 (2件)

「3個以下が10人」ならば、とりあえず代表値として1.5個を選び、そこに10人が集中しているとして処理します。



しかし、この場合は1つの区間内を完全に平等に扱うには疑問を感じますよね。多くの場合、区間幅は、処理結果(特に不偏分散)に影響を与えます。この問題を考えたのは、Yates(イェーツ)という人で、区間幅の影響を除きたい人のために、補正方法を提案しています。「Yatesの補正」で検索してみてください。

なお「8~12」と「12以上」は共存できません。「8~12」「12を超える」と分類してください。

また「12~∞」の代表値は、一般に指定できません。分布の「裾(すぞ)」であることが明瞭であれば「12+(直前の幅の半分)」でしょうが。
    • good
    • 0
この回答へのお礼

9-13個、14個以上でした。すいません…
下限があれば代表で値を取るのですね。上限が無限だと外すべきですね。
区間の幅を変えても補正することができるのですか。

ご回答ありがとうございました。

お礼日時:2009/01/24 23:44

それを言うなら、4~8個の12人だって、


全員が4個かもしれないし、全員が8個かもしれません。
各階級に適当な代表値を設定して、
その平均を取るしかないでしょう。
    • good
    • 0
この回答へのお礼

なるほど…そうですよね。~以上とされている区間も収束していれば推定はできそうですが、
この場合は何とも言えませんね。たとえが悪かったかもしれません…スイマセン。

勉強になりました。ありがとうございました。

お礼日時:2009/01/24 23:47

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!