「これはヤバかったな」という遅刻エピソード

標準体重を求める課題が出ました。その元になる母集団のデータは後ほど出されるそうなのですが、95%以上の信頼のおける数字を出す方法を考えるというものです。ネットや本などで標準偏差や分散なども勉強してみましたが要領を得ません。と言うよりも、自分の欲しい情報にたどり着けません。95%という根拠もどうやって出したらいいものか。算術的平均体重前後に標準偏差の2倍を加減すれば95%の信頼度になるそうなのですが、それでは標準体重に幅ができてしまって、標準にはなり得ません。最頻値というものも標準とは言えないような気がします。初心者どころか、学校では習ったことのないことでもあり、急ぎの仕事なのに時間ばかりが過ぎていきます。初めてかかわる統計学にきっかけが掴めないでいます。数学のカテゴリーの中では低レベルかとは思いますが、どうかご教授お願い致します。

A 回答 (6件)

「標準体重」の意味がよく分からないのですが,母集団から抽出した標本の体重の値が与えられているとき,母集団の体重の平均を推定せよ,という課題でしょうか?



もし違う意味でしたら,ここから先の話は的はずれになってしまいますが,仮にそうだとして進めます。

>自分の欲しい情報にたどり着けません。

この場合,(もし上で仮定したような意味なら)キーワードは「母平均」and「推定」あたりでしょう。

>算術的平均体重前後に標準偏差の2倍を加減すれば95%の信頼度になるそうなのですが、
これは,「正規分布では,平均±1.96σの範囲内に,全データの95%が収まる」という話ですね。(σ=標準偏差)
たしかにこれでは幅が広すぎて,標準にならないですね。

しかし,母平均(母集団の平均)の推定値にも,どうしても幅が出てしまいます。
もし幅を0にしたければ(つまり,母集団の平均値をピンポイントでズバリこの値,というふうに示したければ),標本調査ではなく悉皆調査をするしかありません。

そこで,「母集団の平均値は,95%の確率で,ここからここまでの範囲内に収まっている」(いいかえれば,外れる可能性も5%ある)という言い方をすることになります。
(95%というのは,単によく使われる,きりのいい数字というだけのことで,理論上は何%でも構いません。)

ここから先は数式も出てきますので,分かりやすく説明してあるサイトはないかな,と思って探してみたところ,こんなサイトを見つけました。
「肩のこらない統計学」
http://www.kwansei.ac.jp/hs/z90010/sugakuc/touke …
この中の,「§4 統計的推測」の「1 標準偏差は誤差そのもの」をご覧いただくと良いでしょう。
このページの下の方に,赤色で示された式がありますね。
分母に√nが入っていることから,推定の範囲を半分に狭めようと思ったら,サンプル数を4倍取ってこないといけないことが分かります。

(このサイトは,全体として高校生向けに書かれていますので,もしこのページだけでは分かりづらいようでしたら,ここの初めのほうから読み進んでいかれると理解しやすいと思います。)

ちなみに回答No.2ですが,そういう意味で質問されたのかなあ。

参考URL:http://www.kwansei.ac.jp/hs/z90010/sugakuc/touke …

この回答への補足

課題の意図はおっしゃるとおりです。
ご紹介いただいたページは早速ブックマークしました。
「§4-1 標準偏差は誤差そのもの」のところは、
私の目指しているものです。そこにある例題もぴったりでした。もう一歩のところまで。

今回の私の課題は、実はある乗り物に乗る乗客の体重のサンプルを取り、それを元にして標準体重を求めるというものです。今後この標準体重を使って人数のみで総重量を算出することが最終目的です。
ですから「範囲」ではなく「標準」としての一つの数字が必要になります。悉皆調査のためにすべての人を体重計にのせるわけにもいかないので(怒られてしまいます)、無作為のサンプルをボランティアで取るということになるでしょう。サンプルの取り方も問題が多そうですが、多分「3の倍数の順番に並んだ人」などの方法で機械的に抽出しようかと思っています。

そこで、例の95%以上の確率で正しいとされる標準体重はどうやって求め、何をもって証明すればいいのでしょうか?詳しい説明をしてくださった後に恐縮ですが、宜しくお願いします。

補足日時:2004/09/23 18:33
    • good
    • 0

 #4です。

あなたのおっしゃる「標準体重」は(母集団の)体重の平均の推定値です。#3さんの示してくださっているURLで出てくるページの「母平均の推定」の項目をよくお読みになって、どこが分からないかを教えてください。
    • good
    • 0
この回答へのお礼

そうなんです。母集団の推定だったのです。
ご紹介いただいたページを何度も読むうち、何か分かってきたような気がしてきました。また、見落としていたことですが、課題には「エラー1%の範囲で」とありました。つまり、多くサンプルを取ることでそのエラーの95%の範囲を狭めていくということなんですね。

半分も分かってはいないと思いますが、道筋が見えてきた気がします。ここ数日で、皆様のおかげもあり、かなり統計学というものが身近に思えます。大変ありがとうございました。実際に調査を始めてからまた問題が出てくるかも知れません。そのときは、勝手ですが、またよろしくお願いします。

お礼日時:2004/09/24 19:44

標準体重は、数学や統計学ではなく、栄養学か医学の話です。



 現在では、BMIを使います。BMI=体重(kg)/身長(m)~2で計算します。
 22が理想で、これより大きいと、特に20%増加だと、肥満と判定され、ガン、心臓病、脳血管疾患による死亡率が増加します。22が理想的なので、低くてもこれらの疾病による死亡率が増加すると報告されています。

 BMIが考案されるまでは、標準体重は、日本人の平均値が用いられ、95%信頼限界を超えると、肥満や痩せと判定されていました。

BMIで検索されれば、多くのホームページがあります。
    • good
    • 1
この回答へのお礼

ありがとうございます。

私の質問の仕方がはっきりしていませんでした。
統計学的な用語もにわか仕込みなので自分でもよく分かっていない状態です。すみません。

「標準体重」で検索するとBMIのことばかり出てきました。

お礼日時:2004/09/23 18:43

 「統計学的」な「推定」に関する質問だと理解しました。


 概略は#3さんのおっしゃるとおりで、そこで紹介されているURLのページによく説明してあると思います。

 さて、私からのアドバイスですが、母集団の分布と、母集団から抜き出して(普通無作為抽出して)得られたサンプル(試料)の平均値(あるいは他の代表値)の分布とをはっきりと区別して考える必要があるということです。

 母集団の分布というのは、今の課題の場合、対象となっている集団に含まれているすべての人の体重を測定した時の、その体重の分布ということです。

 サンプルの平均値(あるいは他の代表値)の分布とはいったい何でしょうか?ここでは、代表値として平均値を取り上げて説明します。
 たとえば、母集団が1万人とします。今は全員の体重も分かっているとして、つまり、本当の平均値も分かっているとします。ここでたとえば、無作為に100人の人を選び出して体重を量り、平均値を出したとします。その平均値は、本当の平均値とどのくらい一致しているでしょうか? 100人くらいですと、たまたま偏ってしまって、大きく違う値が出るかもしれませんが、違いが大きい結果が出る可能性は、違いの大きさが大きいほど(その結果が出る可能性は)少ないといえるでしょう。ためしに100人取って計測するということを何回も繰り返すと、おそらくは、本当の平均値と近い値が出ることが一番多く、本当の平均値と違いの大きい値が出る頻度は少なくなっていくでしょう。もし抽出するのが1000人だったとすると、得られる試料の平均値が、本当の平均値からずれる割合は、100人の時よりもずっと少なくなるでしょう。
 で、この、抽出によって得られる平均値の出現の分布という物を考えることができるわけです。(抽出方法を母集団の性質に添ってきちんと選べば)この抽出によって得られる平均値の出現の分布が正規分布と見なすことができるということがあり、そうすると、抽出によって得られる平均値は本当の平均値±2σの中に、含まれる確率が95%ということができることになります。
 したがってこの場合の95%というのは、母集団の個々人の体重の分布の95%ではありません。

 このあたりの理論は、母集団の平均値の推定、という領域になります。代表値になぜ中央値や最頻値ではなく平均値がよいのか(これも場合によりますから、なぜというよりはどういう条件ではというべきでしょうか)という話もそのあたりに出てくると思います。

この回答への補足

丁寧でわかりやすい説明ありがとうございます。
他の方の(回答3補足)に書かせてもらいましたが、範囲ではなく標準値が求めたいのです。「平均値±2σ」の範囲で確率95%ということは、その範囲の中央値や平均値のみでは95%以下になってしまうということでしょうか。そうすると信頼度95%の標準値というものは存在するのでしょうか。

母集団は無限大?可能性で云えば、世界中の人が乗客になり得るわけですから。そうなると母集団の分布を把握することは不可能になります。サンプルは3000人ほどを考えています。ここから「平均値±2σ」を求める。ここまでは分かったのですが、この先、どうやって一つの標準値を求めようかと困っております。私の少ない理解力で調べたところでは、範囲のことはよく書いてありますが、一つの数字に絞ってそれを95%の確率であてはめ標準値とすることはまだ見つかっていません。

皆様のおかげでかなり統計学が分かった気になってきましたが、同時に奥の深さも見てしまい、今更ながら大変さを実感してる次第です。重ねて大変恐縮ですが、もう少しご教授お願いします。

補足日時:2004/09/23 19:55
    • good
    • 0

BMI指数のことじゃないでしょうかね?


今一番使われていますけど。

http://www.ahv.pref.aichi.jp/taikei/chap1_nn.html
http://www.diettown.net/bmical/
http://www.watashi.co.jp/watashi/diet/data/bmi.h …

http://wwwdbtk.mhlw.go.jp/toukei/kouhyo/indexkk_ …

参考URL:http://www.ahv.pref.aichi.jp/taikei/chap1_nn.html,http://www.diettown.net/bmical/
    • good
    • 0
この回答へのお礼

ありがとうございます。
今回の課題は実際にサンプルを取って求めるもの
なので、よく話題に出る医学的なBMIとは違います。
私の質問も要点がぼやけてました。
すみません。

お礼日時:2004/09/23 17:53

「推定」&「統計」という語で検索をかけてみましょう。

    • good
    • 0
この回答へのお礼

確かに知りたいことに近づきました。
ありがとうございます。
簡単な言葉なのに自分では気付かないんですよね。
実は困り度「3」だったので助かります。

お礼日時:2004/09/23 18:02

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!


おすすめ情報