自分は高校生で統計学に興味を持っているのですが
統計学が学べる大学を教えてくださいm(_ _)m
あと、統計に関する仕事はなにがあるかも教えてほしいです!

このQ&Aに関連する最新のQ&A

A 回答 (2件)

仕事



社会の基本は経済活動で、全部数値化して評価してます。
なので、
http://www.ms.u-tokyo.ac.jp/actuary/index.html
こんな感じで、大量の数値データのあるところには、仕事があります。

経済学部の数学のセンスのない人間が数学のセンスのある人間に SOSをだしている感じ。
※ 東大だと、数年前から理系から経済学部への進学振り分け枠が広がるというのと「金融学科」ができるのが同じころ。つまり、数学(とくに統計学)に強い人間は求められている。

私が大学に入った30年くらい前の頃は統計学は
http://ja.wikipedia.org/wiki/%E6%9E%97%E5%91%A8% …
経済学部出身の先生が片手間にやっている感じだったんだけどなぁ。
    • good
    • 0

統計学というと


http://ja.wikipedia.org/wiki/%E7%B5%B1%E8%A8%88% …
ここがご本尊のような気がする。
大学院からしか入れないけど。

統計専門というと、応用数学の中だから、理学部の数学科があるところなら、だいたいあるんじゃないかな。
http://www.ms.u-tokyo.ac.jp/~nakahiro/komaba2005 …
こんな感じ
    • good
    • 0

このQ&Aに関連する人気のQ&A

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人が検索しているワード

このQ&Aと関連する良く見られている質問

Q統計学的に信頼できるサンプル数って?

統計の「と」の字も理解していない者ですが、
よく「統計学的に信頼できるサンプル数」っていいますよね。

あれって「この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる」という決まりがあるものなのでしょうか?
また、その標本数はどのように算定され、どのような評価基準をもって客観的に信頼できると判断できるのでしょうか?
たとえば、99人の専門家が信頼できると言い、1人がまだこの数では信頼できないと言った場合は信頼できるサンプル数と言えるのでしょうか?

わかりやすく教えていただけると幸いです。

Aベストアンサー

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要なサンプル数は、比べる検定手法により計算できるものもあります。
 最低限必要なサンプル数ということでは、例えば、ある集団から、ある条件で抽出したサンプルと、条件付けをしないで抽出したサンプル(比べるための基準となるサンプル)を比較するときに、そのサンプルの分布が正規分布(正規分布解説:身長を5cmきざみでグループ分けし、低いグループから順に並べたときに、日本人男子の身長なら170cm前後のグループの人数が最も多く、それよりも高い人のグループと低い人のグループの人数は、170cmのグループから離れるほど人数が減ってくるような集団の分布様式)でない分布形態で、しかし分布の形は双方とも同じような場合「Wilcoxon符号順位検定」という検定手法で検定することができますが、この検定手法は、サンプルデータに同じ値を含まずに最低6つのサンプル数が必要になります。それ以下では、いくらデータに差があるように見えても検定で差を検出できません。
 また、統計上差を出すのに必要なサンプル数の例では、A国とB国のそれぞれの成人男子の身長サンプルがともに正規分布、または正規分布と仮定した場合に「t検定」という検定手法で検定することができますが、このときにはその分布を差がないのにあると間違える確率と、差があるのにないと間違える確率の許容値を自分で決めた上で、そのサンプルの分布の値のばらつき具合から、計算して求めることができます。ただし、その計算は、現実に集めたそれぞれのサンプル間で生じた平均値の差や分布のばらつき具合(分散値)、どのくらいの程度で判定を間違える可能性がどこまで許されるかなどの条件から、サンプル間で差があると認められるために必要なサンプル数ですから、まったく同じデータを集めた場合でない限り、計算上算出された(差を出すために)必要なサンプル数だけサンプルデータを集めれば、差があると判定されます(すなわち、サンプルを無制限に集めることができれば、だいたい差が出るという判定となる)。よって、集めるサンプルの種類により、計算上出された(差を出すために)必要なサンプル数が現実的に妥当なものか、そうでないのかを、最終的には人間が判断することになります。

 具体的に例示してみましょう。
 ある集団からランダムに集めたデータが15,12,18,12,22,13,21,12,17,15,19、もう一方のデータが22,21,25,24,24,18,18,26,21,27,25としましょう。一見すると後者のほうが値が大きく、前者と差があるように見えます。そこで、差を検定するために、t検定を行います。結果として計算上差があり、前者と後者は計算上差がないのにあると間違えて判断する可能性の許容値(有意確率)何%の確率で差があるといえます。常識的に考えても、これだけのサンプル数で差があると計算されたのだから、差があると判断しても差し支えないだろうと判断できます。
 ちなみにこの場合の差が出るための必要サンプル数は、有意確率5%、検出力0.8とした場合に5.7299、つまりそれぞれの集団で6つ以上サンプルを集めれば、差を出せるのです。一方、サンプルが、15,12,18,12,21,20,21,25,24,19の集団と、22,21125,24,24,15,12,18,12,22の集団ではどうでしょう。有意確率5%で差があるとはいえない結果になります。この場合に、このサンプルの分布様式で拾い出して差を出すために必要なサンプル数は551.33となり、552個もサンプルを抽出しないと差が出ないことになります。この計算上の必要サンプル数がこのくらい調査しないといけないものならば、必要サンプル数以上のサンプルを集めて調べなければなりませんし、これだけの数を集める必要がない、もしくは集めることが困難な場合は差があるとはいえないという判断をすることになるかと思います。

 一方、支持率調査や視聴率調査などの場合、比べるべき基準の対象がありません。その場合は、サンプル数が少ないレベルで予備調査を行い、さらにもう少しサンプル数を増やして予備調査を行いを何回か繰り返し、それぞれの調査でサンプルの分布形やその他検討するべき指数を計算し、これ以上集計をとってもデータのばらつきや変化が許容範囲(小数点何桁レベルの誤差)に納まるようなサンプル数を算出していると考えます。テレビ視聴率調査は関東では300件のサンプル数程度と聞いていますが、調査会社ではサンプルのとり方がなるべく関東在住の家庭構成と年齢層、性別などの割合が同じになるように、また、サンプルをとる地域の人口分布が同じ割合になるようにサンプル抽出条件を整えた上で、ランダムに抽出しているため、数千万人いる関東の本当の視聴率を割合反映して出しているそうです。これはすでに必要サンプル数の割り出し方がノウハウとして知られていますが、未知の調査項目では必要サンプル数を導き出すためには試行錯誤で適切と判断できる数をひたすら調査するしかないかと思います。

> どのような評価基準をもって客観的に信頼できると判断・・・
 例えば、工場で作られるネジの直径などは、まったくばらつきなくぴったり想定した直径のネジを作ることはきわめて困難です。多少の大きさのばらつきが生じてしまいます。1mm違っても規格外品となります。工場では企画外品をなるべく出さないように、統計を取って、ネジの直径のばらつき具合を調べ、製造工程をチェックして、不良品の出る確率を下げようとします。しかし、製品をすべて調べるわけにはいきません。そこで、調べるのに最低限必要なサンプル数を調査と計算を重ねてチェックしていきます。
 一方、農場で生産されたネギの直径は、1mmくらいの差ならほぼ同じロットとして扱われます。また、農産物は年や品種の違いにより生育に差が出やすく、そもそも規格はネジに比べて相当ばらつき具合の許容範囲が広くなっています。ネジに対してネギのような検査を行っていたのでは信頼性が損なわれます。
 そもそも、統計学的検定は客観的判断基準の一指針ではあっても絶対的な評価になりません。あくまでも最終的に判断するのは人間であって、それも、サンプルの質や検証する精度によって、必要サンプルは変わるのです。

 あと、お礼の欄にあった専門家:統計学者とありましたが、統計学者が指摘できるのはあくまでもそのサンプルに対して適切な検定を使って正しい計算を行ったかだけで、たとえ適切な検定手法で導き出された結果であっても、それが妥当か否か判断することは難しいと思います。そのサンプルが、何を示し、何を解き明かし、何に利用されるかで信頼度は変化するからです。
 ただ、経験則上指標的なものはあります。正規分布を示すサンプルなら、20~30のサンプル数があれば検定上差し支えない(それ以下でも問題ない場合もある)とか、正規分布でないサンプルは最低6~8のサンプル数が必要とか、厳密さを要求される調査であれば50くらいのサンプル数が必要であろうとかです。でも、あくまでも指標です。

> この統計を調べたいときはこれぐらいのサンプル数があれば信頼できる・・・
 調べたいどの集団でも、ある一定数以上なら信頼できるというような決まりはありません。
 何かサンプルを集め、それをなんかの傾向があるかどうかという仮説を検証するために統計学的検定を行って、仮設が否定されるかされないかを調べる中で、どの検定方法を使うかで、最低限必要なサンプル数というのはあります。また、集めたサンプルを何か基準とすべき別のサンプルと比べる検定して、基準のサンプルと統計上差を出すに必要な...続きを読む

Q記述統計学と推計統計学について

今統計学について勉強しているのですが記述統計学と推計統計学の違いがいまいちわかりません。
調べてみると以下のようなページをみつけたのですがやはりわかりません。ご存知の方ご教授お願いします。

http://digitalword.seesaa.net/article/36622474.html

Aベストアンサー

大学などで「記述統計学と推測統計学の違いを述べよ」という問題が試験に出るのでなければ、別に両者を明確に区別する必要なんてないと思いますよ。

一応、簡単にいえば記述統計学というのは複雑で大量のデータを整理すること。例えば、単純集計で表にまとめたり、そのデータを適切にグラフで表現するなどですね。

推測統計学(推計統計学)は標本値から母数を推定すること。原則として我々は母数をすることができないので、標本値から母数を推定することしかできません。その推定の「確からしさ」を考えるのが推測統計学です。

ちなみに、例えば、1人の身長データさえ母数を測定するのは不可能です。なぜなら、測定に伴う誤差(例えば測定誤差)が伴うからです。

母数を推定するというと、もっぱら何万人もいる人の集団のデータなんて想像してしまいがちですが、ただ1つの正確な観測値を得るのさえ我々にはできないんです(というのが統計学の考え方)。

Q統計学的に有意かどうかを判断するためのサンプル数

インターネット上に出している広告の有意性を見るためのテストをしているのですが、統計学的に有意かどうかを判断するためのサンプル数としてどれを見るべきなのか分かりません。「サンプル数400あれば、危険率5%で有意」みたいに使われてたと思うのですが、以下のようなケースでは、どう判断したらよいのでしょうか?

■行ったテストの内容

 ABテスト:インターネット上に出した広告の効果があるかどうかを見るために、その広告を表示した「A群」と、その広告は表示せず代わりに関係のない広告を表示した「B群」を作り、比較検討してみた。(B群はあくまでも比較のためなので全体の5%程度表示されるようにした。ちょっと足りませんが。)

■実施結果(まだ途中の段階なのですが…現在のところ)

 □A群:
  ・広告表示回数: 8,434,601
  ・購入数: 321
  ・購入率: 0.00381% (=321÷8,434,601)

 □B群
  ・広告表示回数: 368,696
  ・購入数: 13
  ・購入率: 0.00353% (=13÷368,696)

■質問内容

 ・上記のようなケースで、A群に出した広告は、果たしてどの程度「効果があった」
  と言えるのでしょうか?現状、購入率の違いは、約8%(0.00381% vs. 0.00353%)
  となると思うのですが、この数値は統計学的にどの程度有意と言えるのでしょうか?

 ・ここでのサンプル数というのは、表示回数の8,803,297(=8,434,601+368,696)
  でしょうか?それとも、購入回数の334(=321+13)でしょうか?

 ・統計学でいうところの「危険率」や「信頼区間」は、いくつだということになる
  のでしょうか?


 

インターネット上に出している広告の有意性を見るためのテストをしているのですが、統計学的に有意かどうかを判断するためのサンプル数としてどれを見るべきなのか分かりません。「サンプル数400あれば、危険率5%で有意」みたいに使われてたと思うのですが、以下のようなケースでは、どう判断したらよいのでしょうか?

■行ったテストの内容

 ABテスト:インターネット上に出した広告の効果があるかどうかを見るために、その広告を表示した「A群」と、その広告は表示せず代わりに関係のない広告を表示した「B...続きを読む

Aベストアンサー

「χ^2(カイ2乗)検定」をお調べになると良いでしょう。

Q統計数理研究所の公開講座(統計学概論)

知人が、統計数理研究所の公開講座に申し込もうかどうか悩んでいて、質問を受けました。
なんでも、社会調査(アンケート)の分析をしたいのだが、統計学が苦手なので困っていたところ、
統計数理研究所が公開講座を開いていることがわかったのだとか。でも、一体どの位のレベルのものなのかがわからず、受講を迷っているようです。

受講したい講座は統計学概論だそうで、HPを見たところ「大学文系」レベルとありましたが、それってどのくらいのことなのでしょうか。
社会統計学をちょっとかじったことがある私でも、内容がわからないので彼女に回答をしかねています。
もし、この講座を受講された方がいらっしゃいましたら、どんなことをするのか、お教えください。

Aベストアンサー

受講対象者の数学レベルは、大学文系程度とありますが、大学文系でも数学を勉強した文系の人と全く勉強していない文系の人がいますからこの表現だと難しいですね。
数学が不得意な私が表現するならば・・・。ルート、Σ、分数の計算、数式の変換などが必要です。
だからルート?!全く受け付けない!と言う人は少し難しいと思います。そうで無い方は、学びたい気持ちさえあれば全く問題なく学べると思います。
私は先ほど書いたように数学が得意ではないので、講座の途中数式が出来てきて、変換する課程が出ていないとその場ではついていけなくなってしまうことはありましたが、後で自宅で勉強すれば大丈夫です。ただ理系出身者の話を聞くと、簡単な数式だと言うからうらやましいですよね。

Q統計学的に信頼できるサンプル数

統計の勉強をしておりましたらサンプルの抽出方法が下記に書いてありました。
http://www.wound-treatment.jp/next/wound225.htm

ここでは、10万人の世論調査をする場合2000人必要とのこと。
実際数式に数字を当てはめてみると10万人を超える集団になると
1500人を調査すれば傾向を把握できるということがわかりました。

ここからが疑問なのですが、
「地域別の男女の傾向を把握」したいという調査があるとします。
(東北、関東、四国・・・・のそれぞれ男女別)

東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。
すると、
東北の男性:1500人 女性:1500人
関東の男性:1500人 女性:1500人
四国の男性:1500人 女性:1500人



という調査数でよいのでしょうか??

最終的にその選んだサンプル数の全数で、「男女別の傾向」も
出したいと思っております。


普通に考えると、
人口が多い関東は、人口の少ない四国と同じサンプル数でいいのかという疑問があります。
同じ数だと、全国の傾向を出したいのに
人数の少ない四国と関東が同じであれば、四国の意見傾向にひきづられるような気がします。

そうすると調査人口は変えたほうがいいのでしょうか?
(四国を500人 500人にして、関東を2500人 2500人にするなど)

そうして人数を変えてしまうと
そもそもの、10万人の調査は1500人が必要だという統計上の件数に基づかないので
関東の人口をたとえば4000人に増やすのでしょうか?

それとも、世論調査は2000人あればいいということで
2000人を人口比率で四国・関東・・・・の男女別に割り振ればいいのでしょうか。

よろしくお願いいたします。

統計の勉強をしておりましたらサンプルの抽出方法が下記に書いてありました。
http://www.wound-treatment.jp/next/wound225.htm

ここでは、10万人の世論調査をする場合2000人必要とのこと。
実際数式に数字を当てはめてみると10万人を超える集団になると
1500人を調査すれば傾向を把握できるということがわかりました。

ここからが疑問なのですが、
「地域別の男女の傾向を把握」したいという調査があるとします。
(東北、関東、四国・・・・のそれぞれ男女別)

東北の人数も、関東の人数も四国の...続きを読む

Aベストアンサー

サンプリングの数の最小値は、それだけあれば母集団の傾向を把握できる数ですから、それ以上サンプリングの数を増やしてもあまり結果を改良できない。

>10万人を超える集団になると
>1500人を調査すれば傾向を把握できるということがわかりました。

であれば、母集団が各地域の男女ですから、
>東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。

>すると、
>東北の男性:1500人 女性:1500人
>関東の男性:1500人 女性:1500人
>四国の男性:1500人 女性:1500人
などなど
それでいいと思います。

>普通に考えると、
>人口が多い関東は、人口の少ない四国と同じサンプル数でいいのかという疑問があります。

>四国を500人 500人にして、関東を2500人 2500人にするなど

にすると四国は「サンプリングの数の最小値」を満たしていません。(計算していないので、分りませんが、500人が最小値より小さければ)一方、関東は「サンプリングの数の最小値」を満たしていますが不必要な1000人分の調査費用を無駄に使っていることになります。

一律のサンプリング数にしたければ、各地域の男女の人口から、サンプリングの数の最小値を計算し、その中の最小値プラスアルファできりのいいかずを選べばいいわけでしょう。

サンプリングの数の最小値は、それだけあれば母集団の傾向を把握できる数ですから、それ以上サンプリングの数を増やしてもあまり結果を改良できない。

>10万人を超える集団になると
>1500人を調査すれば傾向を把握できるということがわかりました。

であれば、母集団が各地域の男女ですから、
>東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。

>すると、
>東北の男性:1500人 女性:1500人
>関東の男性:1500人 女性:1500人
>四国の男性:1500人 女性:1...続きを読む

Q統計学における「統計的有意性」

ある書物の中で、統計学における「統計的有意性」に関する批判が有りましたが、何しろ統計学を学んでいないので良く分かりません。誰か「統計的有意性」の意味を教えて下さい。

Aベストアンサー

「統計的」という形容詞は.いくつかの意味が有るので.ここでは省略します。
統計学での「有意性の有無」について.答えます。

一般に使われる統計では「危険率0.05(危険率5%)」という条件がつきます。これは.「1/20の確率で結果が間違う」という意味です。まれに危険率1%の場合が有ります。これは.1/100の確率で間違う(10000回行ったらば100回間違う)ことを意味します。
この「間違う」場合には.次の2通りの場合が有ります。
1.有意さがあるにもかかわらず.有意さがないものとして取り扱う。
2.有意さがないにもかかわらず.有意さがあるものとして取り扱う。
この曖昧さが常に統計では付きまといます。

統計処理の内容によって多少変化しますが.「有意さがある」場合は.2つの集団を比較して.標準偏差の2倍の差が有ったときや.ある事象の発生確率が2倍差が有ったときにです(20回やって1回しか間違わない場合)。
一方.「有意さがない」場合は.すべでの集団の構成する対照を誤差0で測定して.差がなかった場合です。
両者の間.つまり.標準偏差の2倍程度以下(具体的に数値は統計処理方法で多少変化します)の差が有った場合には.統計では「有意さがあるかどうかわからない」状態であり.「有意さが有るとは言えない」と表記します(20回やって.1回を越えて間違う)。「有意さがない」場合では有りません。

標準偏差は.いろいろな数値はある値を中心として適当にバラついて存在します。このばらつきの状態を示す数値です。

「統計的」という形容詞は.いくつかの意味が有るので.ここでは省略します。
統計学での「有意性の有無」について.答えます。

一般に使われる統計では「危険率0.05(危険率5%)」という条件がつきます。これは.「1/20の確率で結果が間違う」という意味です。まれに危険率1%の場合が有ります。これは.1/100の確率で間違う(10000回行ったらば100回間違う)ことを意味します。
この「間違う」場合には.次の2通りの場合が有ります。
1.有意さがあるにもかかわらず.有意さが...続きを読む

Q統計 考古学調査でのサンプル数と結果の妥当性

統計について知識のないものからの質問です。

サハラ砂漠には様々な古墳がありますが、その中で「鍵穴型円墳」が約1000基あります。その内7基の年代測定をしたところすべて紀元前3000年前後に集中しています(CalBC3340-3030~CalBC2910-2700の範囲)。 

この結果を受けて、「この形式の古墳は紀元前3000年前後のもの」と断定してよいものでしょうか。母数に対してサンプル数が少なすぎないでしょうか。 結果の妥当性はどのように考えれば良いのでしょうか。 

別の方の質問への回答で、「正規分布でない場合は最低6-8サンプル必要」との説明を見つけましたが、このサンプル数での妥当性はどのように考えるべきでしょうか。

よろしくお願い致します。(素人の考古学愛好者からの質問)

Aベストアンサー

 ホントに断定するには全数調査が必要で、ひとつでも例外が見つかったらアウト、というのが、考古学で普通に言う意味での「断定」(年代決定の指標として使える)ってことではないかしらん。
 ところで、「紀元前3000年前後」の「前後」というところが600年も幅がある。(逆に言えば「紀元前3000年前後ではない」という表現は一体どういう意味なのか)そこがどのぐらいユルい概念であるかによって、話がずいぶん変わりそうな気もします。
 また、「正規分布を仮定する」なんてのは、よほどの根拠でもない限り採用できないしょう。で、1000個中7つしか調べてないような段階では、たいした根拠なんざ、ある筈もなかろうと思うんですけどね。

 …という注意点を一応気に留めた上で考えてみましょ。

 まず、「紀元前3000年前後である」というのが、ま、なんらか「厳密な性質」なのだと思って、これをHと書く事にします。そして、「ランダムに取ったサンプルがHである確率」をpとしましょう。で、観測事実X:「ランダムに取ったn個のサンプルはどれも性質Hを満たすものだった」から、pを推定しろ、という風に考える。(ただ、本当にランダム調査なのかどうかは、ご質問からは分からない。もし近場のやつをまとめて調べたりしてたら、ランダムとはとても言えない。が、ま、ま、それはさておき。)
 たとえばp=0.65だとすると、p^7≒0.05です。つまり、実は墳墓の65%だけがHを満たす、という状況で、調べた7例が偶然全部Hを満たすということが生じる確率は5%ある。この時に言える推定は、ですから「有意水準5%で、p>0.65だ」ということです。言い換えれば「多分、鍵穴型円墳の2/3ぐらいがHを満たす」という話ですから、これでは仰るところの「断定」にはほど遠い。

 そこで、有意水準5%で p>0.9 となるnを計算すると、 n≧29。
 つまり、「29個のサンプルがどれもHだった」という観測があったとする。その場合、「鍵穴型円墳の90%以上がHを満たす」と言ったとき、それが間違っている確率は5%以下である。このぐらいになると、ちょっと「断定」っぽくなってきます。(サンプルがランダムでない場合には、間違っている確率はもっと大きくなります。)

 ホントに断定するには全数調査が必要で、ひとつでも例外が見つかったらアウト、というのが、考古学で普通に言う意味での「断定」(年代決定の指標として使える)ってことではないかしらん。
 ところで、「紀元前3000年前後」の「前後」というところが600年も幅がある。(逆に言えば「紀元前3000年前後ではない」という表現は一体どういう意味なのか)そこがどのぐらいユルい概念であるかによって、話がずいぶん変わりそうな気もします。
 また、「正規分布を仮定する」なんてのは、よほどの根拠でもない限り採...続きを読む

Q統計できると有利?統計学は必要

無職のため時間があり統計学の勉強をしています。長野県に住んでます。
ハローワークの求人を見ても統計で県内で検索しても一件も出てこないし、いままでいろいろな求人情報を見ても統計必須の職はみたことがないです。それでも統計を学ぶ必要があるんでしょうか。
学者になる予定はありません。県内でマーケティングの求人はほとんどなしです。あってもどうせ経験者のみなんで、経験ない自分には縁がないです。仕事でも今まで一度も使ったことないし、必要に迫られたこともないです。
統計学を習得すべきかどうか悩んでます。
よろしくお願いします。

Aベストアンサー

統計は、直感で理解できない事象を理解するようにするための道具なので、必要ない人は必要ないと思います。

上級職だとか計画する立場の人は、何するにしても統計 (数字) に対する理解がないとお話しになりませんけど、監督職程度なら必要ないですね。

就職に有利かどうかは、あなたがどの程度の職を求めてるのかにも依るでしょう。

どっちにしても大切なのは理解であって、長時間勉強するようなものではないと思います。出来る人は学校で習った程度の知識で十分。後は実戦です。

誰かに統計を学べといわれたのなら、その周辺的な情報を全部出してもらわないとなんともいえませんけどね。

Q統計学の専門家に質問です。教えてください

最近発売された、東海大学、唐津一先生の本に以下のようなくだりがあります。
「統計を取る際に一体どれだけの数を調べればいいか。結論を言ってしまうとサンプル数は約300で十分である。「えっ、たったの300でいいの」と思われるかもしれない。日本には一億三千万の人がいる。その傾向が、たった300人の統計でわかるのか?わかるのである。300人を調べたときの誤差のバラツキは3%以下である。だからそれで十分である。「ええっ?」と思うかも知れない。しかしこれは厳密な統計学が教える理論である・・・・・・・・」
そこで教えていただきたいのですが、
(1)何故サンプル数が300で良いのか?
(2)300人調べた時の誤差のバラツキが何故3%以下なのか?
この2点について数学的、統計学的に分かりやすく教えていただけませんでしょうか?

Aベストアンサー

サンプルは300で十分というのは別に不思議なことはなく、統計学の参考書では最初の方に出てくるお話です。

1.について
統計学では最初から100%は目指せませんので、95~97%ぐらいの確率で云々という話を進めます。その際、大本の根拠になるのが中心極限定理などの基本的な統計学の公式でして、これ自体に反証する人は誰もいません。300で十分ではなく、97%の確率で間違いではないと言い切るのに必要なサンプル数はと計算したらそう出たということです。

2.について
中心極限定理とか正規分布とかこの辺りをキーワードに検索すればひょっとしたら理解できるかも。
まぁ直感的に考えて、その300人の平均が母数のそれと比較して極端にどっちかに偏っている可能性がどれぐらいあるかということです。

Q統計学を学べる大学

こんにちは。私は統計学に興味を持っています。統計学を専門に学べる学部もしくは学科のある大学に入りたいのですが、自分で調べた限りでは、国内にはそういった大学は見つかりません。どなたか統計学を学べる大学をご存知の方がいらしたら、教えてください。

Aベストアンサー

経済以外でしたら、数理情報とかでもありますよ。

とりあえず、「統計学」「シラバス」といれて、検索をかけてみたら結構引っかかります。(それだけ、講義科目として扱っているところがあるということだと思います。)

あとは、教員に統計学の専門家がいれば、講義自体であまり専門的に教えてもらえなくても、ゼミに配置される時にその先生の下で学べば、かなり教えてもらえます。


人気Q&Aランキング

おすすめ情報