アプリ版:「スタンプのみでお礼する」機能のリリースについて

年齢を訊かれた時に、四捨五入(182捨183入?)して答える人は少なく満年齢で答えることが一般的だと思います。
それを前提に考えると、次の事実は正しい(と考えられる)でしょうか?
もし正しいとした場合、一般的な統計調査ではどうなっているのでしょうか?

1.「自分の年齢は33歳」と答えた集団の平均年齢は約33.5歳
2.「自分の年齢が30歳」と答えた人が50人、「自分の年齢が34歳」と答えた人が50人いるような100人の集団の平均年齢は32.5歳

A 回答 (14件中1~10件)

普通、年齢は満年齢で答えるでしょ。

→ ということは、切捨てですね。
たまに、数えの人もいますが・・・。→ 1月1日現在で全員1年をとりますね。

この回答への補足

統計の際には私が質問に書いたような0.5を加えるようなことをしているのでしょうか?
「年齢は切捨てするもの」というルールがあるなら、平均年齢も切捨てすべきではないのでしょうか?

補足日時:2006/08/02 21:49
    • good
    • 0

何を回答すれば良いかよく分かりませんが、


>次の事実は正しい(と考えられる)でしょうか?
これは事実ではなく命題もしくは仮定ですね。

この命題が真となる条件は
・回答者の誕生月の分布が均一である。
・回答者が真実を語っている(年齢をごまかしていない)
です。これが証明できる母集団でなければ真とはいえません(=正しいとはいえません)

統計調査では単純に回答された年齢の平均を出すのが一般的でしょう。

この回答への補足

「事実」と書いたのは間違いでした。すみません。
おっしゃられる2つの条件が成り立っている母集団で回答をお願いしたいと思います。

>統計調査では単純に回答された年齢の平均を出すのが一般的でしょう。
ということは私が2で書いた集団の平均年齢は32とするのが一般的ということですね?
そうなると「○○な人の平均年齢は32.5歳」というニュースを聞いた32歳8ヶ月の男性が「俺は平均より年上」と思うのは誤りとなりますか?

補足日時:2006/08/02 22:01
    • good
    • 0

#02です。


年齢のような階層分布の平均をとる場合に中央値(メジアン)を使うのが適切ではないかということですね。

EXCELの分析ツールやSTATPACKのような統計ソフトを使ったことがありますが、平均は単純に平均値を算出するようですから、やはり単純平均をとるのが統計処理としては一般的だと思います。平均年齢の誤差を小さくするなら月齢まで書かせるのが正しいアプローチでしょう。

ただアンケートに書かれた500万~700万のような年収から母集団の平均年収を求める場合はメジアンを使う場合もあるでしょう。数値の根拠として算出方法を明示してあればメジアンを使うことも間違いではないと思います。

この回答への補足

確かにEXCELには平均を求める関数が備わっています。
しかし、年齢を単純に平均したものを「平均年齢」と呼んで良いのかという疑問は残るのではないでしょうか。

補足日時:2006/08/03 13:10
    • good
    • 0

数学的な答えでは無いかもしれませんが、


統計処理において平均を取ることのメリットは、平均をとることで誤差が打ち消し合って、ばらつきが小さくなることです。

あるアンケートを採って、
「自分の年齢が30歳」と答えた人が50人、「自分の年齢が34歳」と答えた人が50人
だった場合、その平均は32歳か?32.5歳か?を考えます。
母集団全体を調べれば母集団平均がただ一つ求まります、
しかし全員ではなく無作為に一部の人を選んでアンケートなどして母集団平均を推測する場合、結局誤差を含んだ平均しかわかりません。
つまり先ほどの例の場合、本当の平均は32歳+誤差(または32.5歳+誤差)なんです。
ですから結局32歳でも32.5歳でもあまり変わらないと思います。

それに本当にそこまで厳密な話がしたいのであれば、
「あなたの年齢は何歳何ヶ月何日ですか?」と聞けば、それこそ正確に知ることが出来ます。

この回答への補足

TVや新聞で目にする統計調査においてどうしてるのか(0.5を足してるのか否か)を知りたいというのが、今回の質問のもともとの意図です。
そういう統計調査をしている人は統計学を学んでいるでしょうが、授業で年齢のような「切捨てされた値が回答されるデータ」の扱いを統計学の授業で習っているのだろうか?と思ったのです。
抽出した集団の人数から誤差の期待値を求めることができると思いますが、TVや新聞で目にする統計調査における誤差の期待値は、0.5の差が「あまり変わらない」ほどのものなのでしょうか。
TVや新聞での統計調査は世論調査が多いと思いますが、年月日まで答えさせるのは個人情報保護の観点からして適当でないと思います。

補足日時:2006/08/03 13:24
    • good
    • 0

数学は、もともと見解の相違があり得ない学問ですが、ときどき「暗黙の了解」の解釈によって見解が異なる場合があります。


しかし、ごく常識的に考えれば、アンケートの回答では、だれでも端数を切り捨てるでしょうから、あなたの提示した1も2も正しいと言えます。

ただし、表現には数学的でないところがあります。
「平均年齢は約33.5」は「推定母平均(母集団の平均の不偏推定値)は33.5」でなければなりません。「平均」という言葉は「データの平均」なのか「母集団の平均」なのかを明確にしなければなりません。またこの場合は、推定値に「約」をつけてはいけません。推定値が33.51であったことを他人に伝える際に「約33.5」と言うことは構いませんが。

この回答への補足

回答ありがとうございます。
「約」とつけたのは、364/365÷2ないし365/366÷2をほぼ0.5と見なしたい、という考えたからです。
後半の文には「約」をつけないのは中途半端でしたが。

補足日時:2006/08/04 00:02
    • good
    • 0

1 「自分の年齢は33歳」と答えている人は、すべて「33歳」なので、平均は33歳。


2 32歳。

すべて満年齢の平均であり、求めた結果は満年齢です。小数が出たら、そのつど解釈せざるを得ないですが、その「少数年齢」自体を意味の中に入れてはいけません。

この回答への補足

回答ありがとうございます。
できたら補足質問させていただきたいのですが「○○な人の平均年齢は32.5歳」というニュースがあった場合
(A)「32.5歳」というのは満年齢ということですか。
(B)実際上は「33歳0日と同等」と考えてよいのでしょうが「33歳0日」は満年齢ではないということですね。
(C)それを聞いた32歳8ヶ月の男性が「俺は平均より年上」と思うのは誤りとなりますか。

補足日時:2006/08/03 14:50
    • good
    • 0

もしも年齢を年までしか調査していないのに月まで考慮して考えたい、というような話ならば平均33歳を33.5歳と解釈するのもいいかもしれません。


しかし月まで考慮したいなら、そこまで細かく聞くか、調査の際に四捨五入した年齢を答えさせるなどの調査の段階での配慮が必要でしょう。
そこまで細かく考えなくてもokなら、切り捨てで統計処理するように割り切ってもかまわないことになります。

しかし調査で平均33歳と結果が出ても本当の平均(母集団平均)が33歳かどうかはわかりません、誤差がありますから。
本当の平均は32歳かもしれないし34歳かもしれません、どちらにしても多くの人を調査していれば標本平均から大きくはずれることは無いだろうと言うことです。
そういう意味でどちらもあまり変わらないと言ったのです。

例えば1.0℃単位でしか体温を測れない体温計を使っておいて後で36℃だの36.5℃だの言うより、最初から0.1℃単位まで測れる体温計を使った方が正確でしょう?

>TVや新聞での統計調査は世論調査が多いと思いますが、年月日まで答えさせるのは個人情報保護の観点からして適当でないと思います。

これに関しては個人情報保護はあまり関係ありません。
統計で個人情報保護のためにすることはデータの取り方として「Aさん30歳、Bさん25歳、Cさん32歳…」とせずに「30歳が10人、31歳が12人、32歳が9人…」とすることです。
そうすれば結果を見てAさんの年齢を知ることは不可能になり個人情報が保護されます。
さらにデータの平均を取ってしまえば何人から調査したのかも直接にはわからなくなります。
例えば年収を調査する場合100万単位で聞くのはokだけど10万単位で聞くのはダメ、ということにはならないでしょう。
給与明細見せてくださいとか言い出せば別の意味でダメでしょうが。

この回答への補足

回答ありがとうございます。
私は統計を行う立場の人間ではなく、本当は新聞やTVで見かける統計について知りたいのです。
と言っても「それならTV局や新聞社に質問すれば?」という回答を私は期待していませんので、一般論としておうかがいしているのです。

>しかし調査で平均33歳と結果が出ても本当の平均(母集団平均)が33歳かどうかはわかりません、誤差がありますから。
どんな誤差のことを言われているのでしょうか?
「年齢を偽ったり誤ったりして答える人がいる」ということですか?
それとも抽出によって得られた平均値と母集団の平均値の差のことですか?
後者であれば、多くの人を調査することによって誤差(の期待値)を1歳未満にできるのではないですか?

>例えば1.0℃単位でしか体温を測れない体温計を使っておいて後で36℃だの36.5℃だの言うより、
>最初から0.1℃単位まで測れる体温計を使った方が正確でしょう?
では「○○の平均年齢は32.5歳」などという報道を見かけた時に「平均年齢を小数まで発表している
ということは何歳何ヶ月まで回答させているアンケートを実施したのだな」と思って良いのでしょうか?

>これに関しては個人情報保護はあまり関係ありません。
もし仮に生年月日まで質問されるようなアンケートがあったら私は拒否すると思います。
拒否する人が多く出るようなアンケートが正確とは思えません。

補足日時:2006/08/03 16:21
    • good
    • 0

補足に対して



(A)違います。「○○な人の平均年齢は32.5歳」は、32歳6ヶ月とイコールではありません。「歳」で調査されているなら、「場の最低単位」は「歳」です。

ですからこの場合、あくまで「全部足して総数で割った結果、小数点以下が現れた」ということです。それは単純に計算の結果ですので、下位の単位を示すものではありません。No.6のかたが「「小数年齢」自体を意味の中に入れてはいけません」とおっしゃるのはそういうことでしょう。

誕生日が一様に散らばっていると仮定すれば、確かに32.5歳と32歳6ヶ月は近づくでしょう。しかしそれは結果論です。計算する前は存在しなかった概念を、計算結果の時にだけ組み入れるのは不合理です。

(C)ということで、誤りとなるでしょう。32歳8ヶ月の男性も、調査対象であれば32歳です。調査はそこから始まっているのに、結果の時だけ8ヶ月を足すのは感心できる態度とは言えません。ですから「平均より年下」です。


このずれは、始まりと終わりで単位を変えているからと言えます。始まりが「歳」なら、終わりも「歳」。終わりを「月」として扱いたいなら、始まりも「月」にしなければなりません。

だからこそ、No.7さまも「月まで考慮したいなら、そこまで細かく聞くか、調査の際に四捨五入した年齢を答えさせる」必要があるとおっしゃるのです。

(B)ですが誕生日が一様に散らばっているという仮定の下、ご自身で「32.5歳は実質33歳」と思うことはありかもしれません。しかしその仮定を置くことは、結局調査対象に月齢まで聞くのと同じです。それはあまり意味のない行為かもしれません。

なぜなら、お気づきになられたかもしれませんが、ここでも(c)の答えは出てくるからです。「実質平均33歳0ヶ月」と「32歳8ヶ月」を比べれば、やっぱり32歳8ヶ月の方が年下になるのです。

この回答への補足

いくつか理解できない点があるので、質問させてください。

>誕生日が一様に散らばっていると仮定すれば、確かに32.5歳と32歳6ヶ月は近づくでしょう。
満年齢で回答させた場合に平均年齢が32.5歳だったとき、
何歳何ヶ月何日かまで回答させると平均年齢(月齢)が32歳6ヶ月になる(近い)という意味でしょうか?

>しかしその仮定を置くことは、結局調査対象に月齢まで聞くのと同じです。
これはアンケートに回答してくれた人でなく母集団の誕生日分布(
http://wwwdbtk.mhlw.go.jp/toukei/data/012/2001/t …
のようなもの)を使うのが本来ではないのでしょうか?
それとも母集団の誕生日分布は、代用でしかないのでしょうか?

例えば学校で「テストの平均点は32.5点」と言われたとして、33点をとった生徒は一応ほっとできます。
同様な価値基準で考えた場合「結婚年齢は32.5歳」というニュースがあったとき、それをどのように理解したらよいのでしょうか?
「統計上の数であり何ら価値がない」では統計する意味すらないと思うのですが。

補足日時:2006/08/03 17:30
    • good
    • 0

No.8です。



>満年齢で回答させた場合に平均年齢が32.5歳だったとき、何歳何ヶ月何日かまで回答させると平均年齢(月齢)が32歳6ヶ月になる(近い)という意味でしょうか?

すみません、自分でも送ってからバカだなと気づきました。ミスです。近づくわけがないですね。最初のご質問文にある、

1.「自分の年齢は33歳」と答えた集団の平均年齢は約33.5歳

というのが頭に残っていて、「誕生日が一様ならば、33歳の集団を月齢調査すれば平均33歳6ヶ月になりうる」というのは納得できるなと思っていたことが変な形で表出してしまいました。、その部分の具体的な数字は撤回します。言いたかったことはこんな感じです。

ある母集団において年齢だけを聞いたときに出てくる平均値は1つだけ(32.5歳としましょう)で、月齢まで聞いたときの平均値も1つだけ(33歳0.0ヶ月とします)ですよね。誕生日が一様で母集団が十分ならば、両者は近づいて、32.5歳(年齢調査)≒33歳0.0ヶ月(月齢調査)とは言えるでしょうが、その比較は計算の結果論であって、最初から意味として組み込まれているものではない、ということです。


>>しかしその仮定を置くことは、結局調査対象に月齢まで聞くのと同じです。
>これはアンケートに回答してくれた人でなく母集団の誕生日分布を使うのが本来ではないのでしょうか?
それとも母集団の誕生日分布は、代用でしかないのでしょうか?

わかりにくかったかもしれませんね。これは実際にそうするかではなく、考え方の問題です。先の回答文「誕生日が一様に散らばっているという仮定の下」の部分を「誕生日分布をもとにして」と変えていただいても私の言いたいことは同じです。


最終的に……

>例えば学校で「テストの平均点は32.5点」と言われたとして、33点をとった生徒は一応ほっとできます。

に対してです。まず質問者さまご自身が「調査には満年齢で答えている(月齢を切り捨てている)」という前提を置いていらっしゃいますので、そこは動かしません。

ですので調査に対する回答は30歳、31歳、32歳……と返ってきます。中間はありません。その平均を求めてみたら、「結婚年齢32.5歳」と出た。ポイントは、先に書いたように調査の段階で中間がないことです。となれば結果にも中間を求められません。その結果を見て感想を持つ人もまた30歳、31歳、32歳……でしかないわけです。

よって、

>「結婚年齢は32.5歳」というニュースがあったとき、それをどのように理解したらよいのでしょうか?

に関しては、自分が32歳0ヶ月だろうと32歳11ヶ月だろうと「まだ平均より若い」と理解することができます。そして33歳の誕生日を迎えた瞬間、「もう平均より若くない」に変わります。「中間はない」のです。

この回答への補足

>>「結婚年齢は32.5歳」というニュースがあったとき、それをどのように理解したらよいのでしょうか?
すみません「結婚年齢は32.5歳」は「結婚平均年齢32.5歳」の誤りですが、それでも回答に違いはでないでしょうか?

>に関しては、自分が32歳0ヶ月だろうと32歳11ヶ月だろうと「まだ平均より若い」と理解することができます。
>そして33歳の誕生日を迎えた瞬間、「もう平均より若くない」に変わります。「中間はない」のです。
この比較の計算手順を説明していただけないでしょうか?

補足日時:2006/08/03 18:44
    • good
    • 0

>「結婚年齢は32.5歳」は「結婚平均年齢32.5歳」の誤りですが、それでも回答に違いはでないでしょうか?



はい、おなじです。私も平均年齢32.5歳と捉えていました。


>この比較の計算手順を説明していただけないでしょうか?

計算と言うより考え方ですね。説明が難しい……。箇条書きにすると、こうかな。

・調査の段階で、32歳0ヶ月も32歳11ヶ月も「32歳」とする(32歳Xヶ月=32歳)。
・よって、平均値32.5歳は「32歳ならそれより低く、33歳ならそれより高い」という「目安」を示す(32歳「6ヶ月」という下位の単位を含意するわけではない)。
・32<32.5<33(ただし、年齢は小数点以下を持ち得ない)
・最初のとおり、32歳Xヶ月=32歳なので、Xがいくつであろうとも彼(女)は平均値より若い。
・誕生日を迎えると(概念の話なので、この年齢変化は調査結果に影響を及ぼさないとしてください)32歳Xヶ月→33歳Xヶ月になる。
・32<32.5<33なので、33歳Xヶ月は平均値より若くない。

どうでしょうか。質問者さまが何に引っかかっているのか、何となくは分かるのですが、その部分をどうもうまく説明できません。くどすぎて失礼な部分があったらお詫びします。

あるいは、極端に「月齢なんて存在しない! 32の次は33だ!」といちど割り切ってしまった方が話は早いのかもしれません。

この回答への補足

何度も回答ありがとうございます。
そうなると「平均年齢32.1歳」の場合、32歳11ヶ月の人も「まだ平均より年下」ということになるでしょうか?

「調査された人は全て○歳11ヶ月である」というならまだしも
「誕生日の分布は一様である」という仮定は不自然な仮定ではないと思うのですが、
その仮定に基づくと「平均より年上」となってしまいます。
なぜこのような結論の不一致が起こってしまうのでしょうか?

補足日時:2006/08/03 19:49
    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています