ウォーターサーバーとコーヒーマシンが一体化した画期的マシン >>

統計学を学ぶためには?




統計学を専門的に学ぶ為には、やはり大学院に行った方が良いでしょうか?
どのレベルにもよると思いますが、医療従事者で、治療効果のために学会発表や論文発表をしたいと思っています。

A 回答 (2件)

>医療従事者で、治療効果のために学会発表や論文発表をしたいと思っています。



だったら、統計学は単なる補助ツールですよね?
大学の教養課程で学ぶ程度の統計学で十分だと思いますよ。
考え方の基本さえ理解すれば、ツールとしては様々なパソコン上の統計ソフトを活用すれば済む話ですから。「SPSS」「エクセル統計」「Minitab」「R」など。
    • good
    • 0

統計を専門で、しかも医療関係の統計を専門的にやっている大学院というのもないと思いますよ。

    • good
    • 0

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています

このQ&Aと関連する良く見られている質問

Q標準偏差の計算

標準偏差同士の計算はどのように行えば良いでしょうか?
Aの標準偏差を0.1とし,Bの標準偏差を0.01とします。


(A±0.1)/(B±0.01)

上記のような計算を行うのですが、
上記の標準偏差はどのようにすれば求まりますか?

Aベストアンサー

この「標準偏差」は、通常は「誤差」と呼ばれるものです。

誤差をもったもの同士の演算によって、その結果の誤差がどうなるか、というのは「誤差伝搬」ということで整理されています。
↓ こんなサイトを参照ください。
http://www.tagen.tohoku.ac.jp/labo/ishijima/gosa-01.html

数学的には、テイラー展開を使って求めたものであり、それで証明できます。
興味があれな自分でもやってみるとよいです。

ちなみに、与えられた式については

(A ± 0.1)/(B ± 0.01)
= A/B ± √[ (0.1/B)^2 + (0.01/A)^2 ]

となります。

Qxの平均=1/n×Σ[i=1,n]xiで定義されるxの平均の分散を求めよという問題の解き方が分かりま

xの平均=1/n×Σ[i=1,n]xiで定義されるxの平均の分散を求めよという問題の解き方が分かりません。教えていただけませんか。よろしくお願いします。

Aベストアンサー

問題文は正確に全文書かれていますか?

>xの平均=1/n×Σ[i=1,n]xi

はい、これは xi (i=1~n) という要素(データ、統計量)に対する「平均」ということです。

>xの平均の分散

どのような要素を想定しての「分散」なのですか?
「x の平均」が1つしか存在しないのなら、その「分散」は定義できません。
「x の分散」なら、「x の平均:xbar = (1/n) × Σ[i=1,n]xi 」を使って
  σ² = (1/n) × Σ[i=1,n](xi - xbar)²
です。

ある母集団から採取した「n 個の標本」の平均に対して、このような「n個の標本」をたくさん採取したときに、各々の「 n 個の標本の平均」の分布に対する「分散」ということですか?
そうであれば、母集団の分散を σ² とすると、「n 個の標本」を m個採取してきたときの「n 個の標本の平均」の分布では、その分散は
  σ²/m     ①
となります。

もし「母集団の分散」が未知の場合には、「n 個の標本」の分散から推定することになり、この場合に「推定した母集団の分散」は、いわゆる「不偏分散」
 s² = Σ[i=1,n](xi - xbar)² /(n - 1)
ですから、①は
 s²/m = Σ[i=1,n](xi - xbar)² /[ m(n - 1) ]
になります。

問題文は正確に全文書かれていますか?

>xの平均=1/n×Σ[i=1,n]xi

はい、これは xi (i=1~n) という要素(データ、統計量)に対する「平均」ということです。

>xの平均の分散

どのような要素を想定しての「分散」なのですか?
「x の平均」が1つしか存在しないのなら、その「分散」は定義できません。
「x の分散」なら、「x の平均:xbar = (1/n) × Σ[i=1,n]xi 」を使って
  σ² = (1/n) × Σ[i=1,n](xi - xbar)²
です。

ある母集団から採取した「n 個の標本」の平均に対して、このような「n個の標本」を...続きを読む

Q問い自体を否定する回答は0点?

大学1年生です。とある授業で、出席票を兼ねて授業毎にコメントシートの提出を求められます。そのコメントシートには教授から出された問いに対する自分の考えを書くようになっています。先日の問いは「移民に対する偏見をなくすにはどうしたらいいか」というものでした。
私は偏見をなくすのは不可能だと思っているので、「そもそも偏見をなくすのは不可能であると考える」という出だしで回答を書きました。
提出してから思ったのですが、問い自体を否定する回答はやはりダメでしょうか。
0点ですかね…

Aベストアンサー

その授業とは「講義」のことだろうか?
講義ならそのような行為はNGである。

なぜなら講義とは「知識の伝授の場」であり、
そこで行われるテストとは知識の伝授の度合いを計るためのものだからである。

「問いの否定」は伝授の度合いを測る材料とならず、無回答と同じこととなる。
「~について述べよ」とはそのままの意味ではない。
「~について講義で伝えられたことを述べよ」ということである。
または「講義で示された指針に合うように解答せよ」ということである。

よく「学問の自由と言われるのだから、学生が自分の意見を述べることも自由である」と息巻く奴がいるが、壮絶な勘違いである。
学問の自由とは「学問的探究」つまり研究の自由であり、講義で学生が好き勝手述べる自由ではない。

重ねて言うが、講義とは知識の伝授の場である。
学生が独自に探究する場ではない。
そのような活動は院生でもできるかできないかである。
知識の伝授はふつう講義とテキストを通して行われる。
テストの回答はそこで述べられた言葉またはそれに準じる言葉を用いなければならない。

Q統計解析について、Kruskal-Wallisでの変数選択→決定木分析 三群にクラス分けされた群がど

統計解析について、Kruskal-Wallisでの変数選択→決定木分析


三群にクラス分けされた群がどの様な項目が特徴的に分類されるか、決定木分析で解析したいのです。

決定木分析の独立変数を選択する際、Kruskal-Wallis検定で有意差の出たものを投入するという、統計処理方法は、良いのでしょうか?

統計学を専門的に学んだ事がなく、独学で勉強しているものです。

お願いします。

Aベストアンサー

企業でSQCを推進する立場の者です。
実は、どんな回答が付くか見守っていました。

決定木は教師あり学習です。二進木とも呼ばれます。でも、ご質問者は3群だと言ってみえます。これが出来るソフトは、SPSS(IBM)のAnswerTreeしかありません。

ですから、回答が限定的になり、誰も回答しないのではないかと思います。

決定木は独立変数が多くても解析上は問題ありませんが、なぜ恣意的な絞り込みをしたかったのか、まずはその目的を述べないと、絞り込み方法が適切だったのかどうかは判断できないと思います。
決定木は、効いている変数の絞り込みに使われる手法ですから、なぜその前に別の方法で絞り込むのか、それが必要なマズイ原因でもあるのでしょうか。

Q数学(統計学): 母集団とサンプル数から上下の誤差範囲が何%になるか算出する方法

統計学だと思うのですが
母集団が184000人で、
サンプル数が150人の場合
上下の誤差範囲は何%になりますでしょうか。

参考サイト: https://www.web-research.net/column/article25/

この解を出すできるだけわかり易い数式もいただければ助かります。
よろしくお願いします。

Aベストアンサー

>サンプル数が150人の場合

無作為に 150人を抽出したのであれば、この「150人のサンプル」の平均値は正規分布するとみなせます。
このサンプルの平均を μ、標準偏差を s とすると、母集団の平均の存在する範囲は、信頼度 95%なら
 μ - 1.96s/√150 ≦ 母集団の平均の95%信頼区間 ≦ μ + 1.96s/√150    ①
となります。
1.96 は、正規分布で「95%がその中にある」という範囲で、下記の「標準正規分布表」から読み取ります。

↓ 標準正規分布表:ふつうの表は「上半分」しか書かれていないので、「95% = 0.95」であれば、その半分の「0.475」となる Z の値を読み取ってください。「0.475」なら Z=1.96, 「0.495」(信頼度 99%)なら「2.57」です。
https://www.koka.ac.jp/morigiwa/sjs/standard_normal_distribution.htm

(この意味を理解するには、「標準偏差」の「確率分布」を理解する必要があります。下記のようなことです。上記の「1.96s」は「1.96σ」ということです)
http://www.stat.go.jp/koukou/howto/process/p4_3_2_1.html

上記の区間の範囲 ±1.96s/√150 が「誤差」ということになります。
これが一般論としての「推定誤差」です。


あとは、サンプルによって何を調べたいのか、というデータの中身になります。
「150人の身長」とか「体重」ということであれば、150人のデータから平均や標準偏差を計算して①を使って母集団の平均の範囲を求めます。その「区間幅」が誤差(の2倍)ということになります。
①式の「1.96s/√150」(一般のサンプルサイズが n の場合には「1.96s/√n」)が「わかり易い数式」に相当すると思います。

ただ、参考サイトに書かれているものは、こういった「身長」や「体重」といった「分布する数値」ではなく、アンケート調査や世論調査の「内閣支持率」のような「〇か×かの比率」のような二者択一の結果です。
このようなもののサンプルデータからは、上に書いたような「標準偏差」は単純には求まりません。

このような「確率 p の事象が、起こるか起こらないか」の二者択一の「起こる回数」は「二項分布」します。
「n 回やって、k 回起こる確率」は
 P(n, k) = nCk * p^k * (1 - p)^(n - k)   ②
で表わされます。

この場合には、
・期待値(起こる回数の平均値):E = np
・その分散(ばらつき):V = np(1 - p)
となります。

これをサンプルサイズによらない「確率」として扱うと
平均 μ = E/n = p
標準偏差 s = √(V/n) = √[p(1 - p)]
サンプルサイズ: n に相当
ということになります。

これを①式にあてはめると
 p - 1.96[√p(1 - p)] /√n ≦ 母集団の確率の95%信頼区間 ≦ p + 1.96[√p(1 - p)] /√n
→ p - 1.96√[p(1 - p)/n] ≦ 母集団の確率の95%信頼区間 ≦ p + 1.96√[p(1 - p)/n]
ということになります。

この「1.96√[p(1 - p)/n] 」が「誤差」に相当することになります。
p がいくつか、ということに依存するので、「サンプルサイズ n が決まれば一律に決まる」というものではありません。

たとえば、コイントスのような p=1/2 のような場合には、
 誤差 = 1.96 * √[ 0.5 * (1 - 0.5)/150 ] = 0.08000166・・・ ≒ 0.08 (=8%)
サイコロのような p=1/6 の場合には
 誤差 = 1.96 * √[ (1/6) * (1 - 1/6)/150 ] = 0.05964・・・ ≒ 0.06 (=6%)
ぐらいになります。


ただし、上記は「母集団が無限大」という場合の数値です。サンプルサイズに比べて母集団がそれほど大きくない場合には、「有限数補正」(有限母集団修正)というものが必要になります。
そのときの補正係数は、母集団の数を N、サンプルサイズを n とすると
 √[ (N - n)/(N - 1) ]
となります。
https://toukeigaku-jouhou.info/2017/04/03/correction-of-finite-population/

ご質問の場合には、この補正係数は
 √[(184000 - 150)/(184000 - 1)] = 0.999595・・・ ≒ 0.9996
なので、ほとんど考慮する必要はないと思います。

>サンプル数が150人の場合

無作為に 150人を抽出したのであれば、この「150人のサンプル」の平均値は正規分布するとみなせます。
このサンプルの平均を μ、標準偏差を s とすると、母集団の平均の存在する範囲は、信頼度 95%なら
 μ - 1.96s/√150 ≦ 母集団の平均の95%信頼区間 ≦ μ + 1.96s/√150    ①
となります。
1.96 は、正規分布で「95%がその中にある」という範囲で、下記の「標準正規分布表」から読み取ります。

↓ 標準正規分布表:ふつうの表は「上半分」しか書かれていないので、「95% = 0....続きを読む

Q統計の問題です この写真の(b)の分布を述べろとはどういう風に答えればいいのでしょうか?

統計の問題です
この写真の(b)の分布を述べろとはどういう風に答えればいいのでしょうか?

Aベストアンサー

No.1です。「補足」を見ました。(d) ですか。

前半は、(Xbar - μ) の期待値は 0、S^2 はおそらく「不偏分散」だと思うので √(S^2 /n) は標本平均の分布の標準偏差です。ということは、分布としては「平均が 0、標準偏差が 1」の正規分布となります。「標準正規分布」と呼ばれます。

「不偏分散」は、標本の二乗偏差和を「標本サイズ - 1」で割ったものです。つまりは、「不偏分散」に「標本サイズ - 1」(n - 1) をかけたものは「標本の二乗偏差和」ということです。
「標本の二乗偏差」(n 個)の合計(二乗偏差和)と「母分散」の比は「カイ二乗値」と呼ばれ、この場合には「自由度 (n - 1) のカイ二乗分布」します。
従って、後半に示された統計量の分布は「自由度 (n - 1) のカイ二乗分布」です。

各々の詳しい定義や意味は、テキストを見てください。

Q大学の課題丸投げについて 見逃し? 気づいていない?

教えて!gooでよく数学の質問について回答しているのですが、そこには大学の課題らしきものも含まれます。最近で言えば「統計学」や「線形代数学」、「C言語」があります。

釣り質問かどうかは置いておき、知恵袋ではレポート丸投げ質問に対して、教員が注意を促す回答や、不正行為として罰する旨を書いた回答が書いてありました。

①課題の投稿に対して、教員が注意を促す投稿
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10144853095

②課題丸投げに対して警告
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q11176765841

他に「エネルギー変換工学」のレポート課題の質問が有名ですが、よく考えてみると課題丸投げの質問は「ヤフー知恵袋」や「教えて!goo」、プログラミングならば「Teratail」などで毎日のように、大量に投稿されていますが、私個人はこの3件しか見つけられませんでした。

多くの教員は課題丸投げに気づいていないのでしょうか?それとも大目に見ているのでしょうか?

教えて!gooでよく数学の質問について回答しているのですが、そこには大学の課題らしきものも含まれます。最近で言えば「統計学」や「線形代数学」、「C言語」があります。

釣り質問かどうかは置いておき、知恵袋ではレポート丸投げ質問に対して、教員が注意を促す回答や、不正行為として罰する旨を書いた回答が書いてありました。

①課題の投稿に対して、教員が注意を促す投稿
https://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q10144853095

②課題丸投げに対して警告
https://detail.chiebu...続きを読む

Aベストアンサー

いつも書いていますが,天網恢恢疎にしてもらさずです。ここで質問して答がもらえたとして,それが質問者の実力になることは,ま,10人に一人くらいでしょう。そもそもここに答を教えて欲しいという学生さんの知的レベルはかなり低いので,ここで得た回答も覚えるだけで学ぶことをしませんから身につかないのですよ。出題している教員もそのくらいはわかっていますよ。ここで得た答を使った宿題がすべて80点以上であっても,期末試験は実力ですから60点に至らないといった学生は毎年一割くらいはいましたねぇ。ま,それで合格して卒業しても,困るのは本人です。僕ら教員は責任もないしどうでもいい。会社は成績証明書を見て「お,この人は優秀だ」と思っていろいろ任せますが,結局何もできない・・・というわけで40歳になっても課長にもなれないってわけ。

Q統計学の平均値の誤差範囲って何ですか? 平均値に誤差なんて出るのですか? 平均値には全てにおいて誤差

統計学の平均値の誤差範囲って何ですか?

平均値に誤差なんて出るのですか?

平均値には全てにおいて誤差範囲というのが存在するのですか?

Aベストアンサー

#4です。

「平均値の差の検定」を間違えていることに気付きました。
私の記述は、A社B社「2組の平均値の差の検定」ですので、平均値の差の期待値は0、分散は分散の加法性で、σ^2/nの2倍になりますので、平均値の差はN(0,2σ^2/n)の正規分布に従うとして検定せねばなりません。

スミマセンでした。

Q大きさNの有限母集団(θ1、…θn)の中から、非復元抽出で大きさnの標本X1、X2、…Xnを無作為に

大きさNの有限母集団(θ1、…θn)の中から、非復元抽出で大きさnの標本X1、X2、…Xnを無作為に取り出す時のX1の分布の平均の求め方を教えて欲しいです。

Aベストアンサー

X1、X2、…Xn の間で、抽出後に特に並べ替えをしないのであれば、
X1 の平均は、母集団から 1 個無作為抽出したときの平均と同じです。
つまり、母集団平均 (1/N)Σ[k=1..n]θ_k ですよ。

Q統計学の質問です、対数正規分布の期待値と分散の最尤推定量の求め方がわかりません。 期待値と分散をαと

統計学の質問です、対数正規分布の期待値と分散の最尤推定量の求め方がわかりません。
期待値と分散をαとβにして、解こうとしてるのですが、よくわかりません。教えて欲しいです。

Aベストアンサー

企業でSQCを推進する立場の者です。博士(工学)です。

最尤推定量は、
①密度関数の値をn個掛け合わせて、それを尤度関数とし、
②それを微分して0と置くことで、xiとnの式として解いた値(μやσ)です。

ですから、α、βと置いても正規分布の式のμとσのままでも、上のやり方で解けます。ただ、2変量ですので偏微分が大変ですね。どう考えてもσはμに依存しますからね。
データサイエンスの教科書ではグリッドサーチ(刻んで解く方法)で、底面がμとσの軸でz軸が尤度ってグラフが出てきます。

また、それらは、#1さんの書かれた、平均は1次の積率、分散は2次の中心積率あるいは分散の公式(ただし、いずれも不偏分散にはならない)に一致します。


このQ&Aを見た人がよく見るQ&A

人気Q&Aランキング