アプリ版:「スタンプのみでお礼する」機能のリリースについて

年齢を訊かれた時に、四捨五入(182捨183入?)して答える人は少なく満年齢で答えることが一般的だと思います。
それを前提に考えると、次の事実は正しい(と考えられる)でしょうか?
もし正しいとした場合、一般的な統計調査ではどうなっているのでしょうか?

1.「自分の年齢は33歳」と答えた集団の平均年齢は約33.5歳
2.「自分の年齢が30歳」と答えた人が50人、「自分の年齢が34歳」と答えた人が50人いるような100人の集団の平均年齢は32.5歳

A 回答 (14件中11~14件)

4度目、登場させていただきます。



>そうなると「平均年齢32.1歳」の場合、32歳11ヶ月の人も「まだ平均より年下」ということになるでしょうか?

>「調査された人は全て○歳11ヶ月である」というならまだしも「誕生日の分布は一様である」という仮定は不自然な仮定ではないと思うのですが、その仮定に基づくと「平均より年上」となってしまいます。なぜこのような結論の不一致が起こってしまうのでしょうか?

分かった!(ほんとかよ)

質問者様は、この平均32.x歳を「32歳を少し超えた『年齢である状態』」と見なしているのではないですか?(そう取ると再質問が腑に落ちるのです) そうではないんです。調査を整数としているこの場合、たとえば32.1歳という平均は、「平均値に近い整数でもって『互いに素』になるまで均していくと、最終的に32歳が9人と33歳が1人の集団ができる」ということです。32.5歳なら最終的に32歳と33歳が1人ずつ。32.8歳なら最終的に32歳1人と33歳4人です。

最初に戻りますが、32.5歳が32歳6ヵ月を意味しないのはそういうことなんです。

さらにこれでどうでしょう。平均32.1歳というのは、「究極的」には「32歳が9人、33歳が1人の集団」であり、しかも「彼らの誕生日はランダム」なのです(*)。その上、彼らは自分の年齢を申告するときに満年齢でやっており、さらにみんな月齢は気にしていません(満年齢で調査して月齢を切り捨てるとはそういうことです)。

この条件下において32歳11ヵ月の人が集団を見回します。すると、「同い年」が自分も含め9人いて、「1つ上」が1人いる。結果、「俺(わたし)は平均値32.1歳には届いていない!」となるではないですか(**)。

この状態が拡大していったものが、「調査で得られた平均32.1歳なのです。前提段階で差異を持たせていないから、32歳11ヵ月と32歳0ヵ月は等価値であり、32歳11ヵ月も平均(32.1歳)より若いのです(***)。

これ以上の説明を思い浮かぶ自信がないです(笑)。
いかがでしょう。

―――――――――――

(*)これだと偏りが大きいですが、それは「究極的に縮めてしまった」からです。本来は母数が大きいので偏りはないはずです。もちろん結果はおなじです。


(**)重ね重ね申し上げますが、ここで、「でもあんた32歳11ヵ月だよね」というのは反則です。この集団は満年齢で集めた集団であり、月齢は無視するという「前提」(質問者様のおっしゃる前提)があるのですから。前提にないものを結論部でだけ持ち出してはなりません。

(***)それでもなお32歳11ヵ月が平均より若いかどうかを確かめたければ、「満年齢で集めた平均32.1歳の集団は、誕生日分布に従えば平均何歳何ヶ月に該当するか」を計算し、その数値と較べるしかないでしょう。これは「下位の単位」を付け加える作業であり、前提の変更になります(満年齢で答えるのが一般的→月齢で答える)。しかし調査したあとに前提を変えるなら最初からその前提(月齢)で調査すればいい、というのがNo.8の後半部分の趣旨です(たぶんNo.7のかたの温度計の話もそうではないでしょうか)。

――――――――――――

ところで、「月齢」という言葉を本来の用法とはかけ離れて使ってしまいましたが、「満年齢」と対比させる言葉が欲しかったためです。ツッコミはなしでお願いします(笑)。

この回答への補足

こういう議論だったらいかがでしょうか?
ちょうど平均年齢(満年齢を単純平均したもの)が32.1歳になるような9人の集団を考える。
ここに32歳11ヶ月のAさんが入り込み10人の集団を作る。
この集団を生年月日の古い順に5人ずつにわけ、年寄り組と、若者組に分けたとする。
このとき、Aさんが年寄り組にいる確率と、若者組にいる確率はどちらが大きいか?
あくまで確率の問題ですが、0.5を加えたものと比較する方が良い結果を生むような気がするのですが、いかがでしょうか?

補足日時:2006/08/03 23:33
    • good
    • 0

>ちょうど平均年齢(満年齢を単純平均したもの)が32.1歳になるような9人の集団を考える。


>ここに32歳11ヶ月のAさんが入り込み10人の集団を作る。
>この集団を生年月日の古い順に5人ずつにわけ、年寄り組と、若者組に分けたとする。
>このとき、Aさんが年寄り組にいる確率と、若者組にいる確率はどちらが大きいか?

満年齢で考えるという前提が置かれているならば、Aさんの年齢は32歳であってそれ以外ではあり得ないと思うんですが。
数学的に統計的にn歳mヶ月をn歳と扱うと決めてしまえば、比較するときにもn歳mヶ月をn歳としか扱えないんだから月まで考慮しての比較は出来ないと思います。
(平均の小数部まで考慮することは出来ますが、これは月とは別の考えですから)

32歳1ヶ月と32歳11ヶ月の二人でも、上の決まりに従って32歳と32歳の二人としてしまえば区別は出来ないし同い年でしかあり得ないと思います。
年齢を尋ねる際に月を考えないんだったら、0歳10ヶ月年上だと主張することには意味はありません、それは0歳年上だと言っているのと変わりません。

このことは月まで考慮するとか、四捨五入した年齢を考えるとか、別のルールにしてしまえばまた話は違ってくるでしょう。

この回答への補足

統計作業は「満年齢で考える前提が置かれている」ではなく「満年齢までしか回答させていない」ということではないのでしょうか?
言わば「切捨てした値でしか表示できない測定器」のようなものであり
測定の結果「32」と表示された物の平均は32.5と考えるのが妥当ではないのでしょうか?

補足日時:2006/08/04 09:26
    • good
    • 0

>統計作業は「満年齢で考える前提が置かれている」ではなく「満年齢までしか回答させていない」と



いうことではないのでしょうか?

その通りと言えるでしょう。だから「結果を見る側」も「満年齢」で考え「なくてはならない」んです




>言わば「切捨てした値でしか表示できない測定器」のようなものであり、
>測定の結果「32」と表示された物の平均は32.5と考えるのが妥当ではないのでしょうか?

なるほど、おっしゃりたいことが分かってきました。ではそういうデジタル温度計で水温を測ってみましょう。40000個のビーカーの水を測定すると、それぞれ10000個ずつ4℃、6℃、7℃、8℃と出ました。平均は6.25℃です。「この測定で言えること」は、「6℃のビーカーはすべて平均より冷たい」ということです。「6℃のビーカーには6.0℃も6.9℃もあるかもしれない、しかし6℃として扱ったときの平均」ですから。ところが突然0.1℃単位の温度計を持った人が現れて6℃のビーカーのうちふたつを測り、「このビーカーは6.7℃、こっちは6.8℃だ。だからこのふたつは平均より熱いんだ」と言いだしました。この「0.1℃単位の温度計を持った人」が質問者さまです。

これらのの水が本当に平均より熱いかどうかは、「実際に0.1℃単位ですべてのビーカーの温度を測

る」(つまりn歳mヶ月まで調査する)か、あるいは「ビーカーの温度は0.1℃単位で一様に散らばっ

ていると仮定して計算し直す」(つまり誕生日分布をもとに計算する)かしかありません。ここで質問者さまは散らばっていると仮定して計算することを選びました。平均は6.74995℃のようです。ここにおいて「初めて」、6.7℃は平均より冷たく、6.8℃は熱いことが判明しました。

満年齢の場合も同じです。満年齢をもとにして平均年齢が32.1歳になったとき、「この段階」では32歳0ヶ月も32歳11ヶ月も32歳として扱われます(切り捨てた値の測定)から、32歳11ヶ月は「平均よりも年下」です。ただし、誕生日が一様に散らばっていると仮定した場合(より細かい測定の代わりに計算を行う)、「どうやら32歳7ヶ月1週間あたりがより細かい平均であるという蓋然性が高そうだ」となり、そこまで考えて「初めて」、「32歳11ヶ月は平均32.1歳より年上と考えるのが妥当かな」と言えるわけです(その意味ではNo.8の最後の段落は不正確でした。お詫びします)。

>測定の結果「32」と表示された物の平均は32.5と考えるのが妥当ではないのでしょうか?

おっしゃるとおりです。サンプルが多数で一様な場合、確かに妥当性は存在すると思います。しかし、それを主張なさるなら、同時に「そのような細かい分析は予定されていない」という調査段階でのルールも受け入れてください。整数単位での調査なら整数単位で分析されるのです。No.12でも言われていますが、その下の単位の分析をしたいなら別のルールを導入する必要があり、「いきなり」「切り捨て平均32は実質32.5が妥当」とは、たとえそれが正解でも、最初のルールに存在していない以上言えません。なぜなら、そこでルールを飛び越してしまうと、0.01℃まで測れる温度計を持った人が現れて、「このビーカーは6.75℃だ」と言い、再計算の果てに0.001℃まで測れる人が現れ……と、下の単位へと際限なく広がっていくことを許してしまうからです。

調査には定められた単位のラインがあり、分析はそれにそって行う。そうであることと、質問者さまのおっしゃる「妥当」は別の次元に存在する、ということです。

この回答への補足

デジタル温度計の例で言えば「4.0℃」と表示されるのは4.0℃~4.99…℃の場合
ですから、階級値で言えば4.5℃になるのではないのでしょうか?
機械がするのよりも精密な作業をする職人がいるそうですが、
もし、そんな職人が、このデジタル温度計を使って仕事をする時には、
「このデジタル温度計は他の温度計より0.5℃低めに出る」と思いながら作業をするでしょう。
切捨ては四捨五入以上に真の値から遠ざかる蓋然性が高く“一般的”ではないからです。
「切捨てで表示される温度計」とは言わば「平均して-0.5℃低めに出る温度計」なわけであり
その温度計で測定した結果の単純平均を何の補正も無しに発表するわけです。
それでも「これは切捨てをする温度計で測定しました」と併記されているなら構いません。
しかし切捨てであることを併記しないで「平均が6.25℃だった」と発表することは、
悪意に捉えれば、わざと約0.5℃低めに発表した、とも受け取れます。

さて、ここで私が本当に質問したいことなのですが、一般にTVや新聞での記事には、
満年齢で回答させたか、何歳何ヶ月まで回答させたかは明記されていません。
明記が無いことによって0.5の誤解を生むかもしれないのに、です。
以前に回答いただいた中に「年齢を偽って答える人がいるかもしれない」とありましたが
それは私が問題にしていることより、影響は小さいと思います。なぜなら、
1歳マイナスして回答する人と同じくらい1歳プラスして回答する人もいるだろうと
推測できるからです。それに調査時に気をつければ減らすことはできるでしょう。
しかし満年齢であることが明記されずに発表される可能性が高いにもかかわらず
満年齢で回答させるのは「全員が平均して-0.5歳偽って回答する」のと同じなわけです。
「TV局や新聞社がどうやって発表するかまで、統計する側では制御できない」と
言うのであれば、統計する段階で何らかの配慮(0.5をプラスするなど)を
行うべきなのではないかと思うのですが、どうやっているのでしょうか?
というのが、私の質問の趣旨です。

こういう回答でも構わないのですが、これは正しいでしょうか?
「一般に、満年齢で調査した時は平均年齢を小数で表し、
何歳何ヶ月まで回答させた時は平均年齢も何歳何ヶ月という形で表す。
後者の形式で表記したいなら、前者の値に0.5を足してから行うべきである。」

補足日時:2006/08/04 20:52
    • good
    • 0

>「一般に、満年齢で調査した時は平均年齢を小数で表し、


何歳何ヶ月まで回答させた時は平均年齢も何歳何ヶ月という形で表す。後者の形式で表記したいなら、前者の値に0.5を足してから行うべきである。」

ほぼ正解だと思います。ただ、No.11で書いた「小数点以下は整数部分から月数が超えていることを意味するわけではない」ということも踏まえていただければ幸いです。

たとえば満年齢平均32.1歳という数字が出たとします。これは書いたように、究極的に32歳が9人と33歳が1人の集団です。そして、この集団の誕生日が一様であると認識して初めて、その平均は「32歳7ヵ月と1週間」と変換できます。ですから、「平均は32.1歳」を、その蓋然性の高さを踏まえた上で「平均は32歳7ヵ月」と発表するのは近似的に間違ってはいないでしょう。

ただし、これを「32.6歳」として発表するのは×です。これだと「究極は32歳2人と33歳3人の集団」という調査結果に変えてしまうことになりますから……うーん、ただし、「小数点以下が月に対応するように補正しました、平均は32.6歳です」と発表すれば、とりあえず32.6歳という数字を使っても間違いではないのでしょうが、これはつまり「変換作業を行った」と同義であり、小数点以下の意味合いが元の調査とは変質しています(究極的な集団の割合を示すものから、月まで含めた歳の細分を示すものへ)。それだったら32歳7ヵ月と書いた方が親切かと。


質問者様のご意見をふまえて、わたしの結論としてはこうです。
・満年齢の調査なら、32.1歳と発表することは純粋に計算結果を示すことであり、それはそれで意味がある(そもそもこの数値がなければ変換もできない)。
・質問者様のように補正すべきと考え、そうしたのなら、「補正しました」と書いた上で、32歳7ヵ月と発表すればよい。小数点以下の意味を明記した上で32.6歳としても間違いではないが、不親切。
・なにも書いていなければおそらく満年齢調査だと考えられるので、結果を見る側がもっと細かく知りたいのならば、発表された数値を変換する(誕生日が一様ならば、発表数値に0.5を足して月変換すればそれなりに近い数字が出ると思われる)。
・おそらく最も親切なのは、「満年齢の相加平均は32.1歳です、これは誕生日の分布を勘案すると32歳7ヵ月1週間に相当すると言えます」という発表。


そして最終的に、

> 「TV局や新聞社がどうやって発表するかまで、統計する側では制御できない」と言うのであれば、統計する段階で何らかの配慮(0.5をプラスするなど)を行うべきなのではないかと思うのですが、どうやっているのでしょうか?

という質問に対しては、「どうやっている」どころか、おそらくそのような配慮は「なにも」しておらず、満年齢をぜんぶ足して、総数で割った数字を発表しているだけでしょう(やっているなら質問者様も私も目にしているはずです)。だからそれを知らされるこちら側がもっと細かく知りたいのなら、変換する必要があります、ということになります。
    • good
    • 0
この回答へのお礼

何度も回答ありがとうございました。
この質問をするまで、漠然と「満年齢である」とは思いながらも
はっきりと「切捨てである」という認識をせずに記事を眺めてしまっており、
ある意味「数字の恐さ」を思い知りました。

例えば10万数千から10万に減っているだけなのに、グラフは10万以上の
部分だけを示して「激減している」などという印象をもたせるような
「悪どい」ものも見かけると、発表する側の良心を疑いたくなります。

次に何か新たな疑問が出て、締め切りの必要がでるまで、
締め切るのは保留にさせていただきたいと思います。

お礼日時:2006/08/05 00:21

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています