サンプルデータをExcelに入力すると、t検定・F検定を行ってくれるシートを作成したいと考えています。
ttest、ftest関数を使うらしいというのは分かったのですが、関数が何をしてくれているのか仕組みを知らないまま使うのは不安です。
高校の文系学科にいるため、数Ⅰ・数Aのそれぞれ一部分しか習っていません。今は数学の授業を選択していないため、数学の先生にもなかなか会えず質問できずにいます。
t検定・F検定がどういうもので何をしているのか、理解するために一番良い勉強方法を教えて頂けないでしょうか。
(たとえば、数Ⅱの中の○○という単元→××という単元の順で勉強すべき、など……)
A 回答 (5件)
- 最新から表示
- 回答順に表示
No.5
- 回答日時:
No.1&4です。
ご承知のことかと思って書きませんでしたが、エクセルの統計関数を使うにせよ、統計ツールを使うにせよ、「検定」の手順は下記となります。(1)何を検定したいかを定義する。通常は「否定したいこと」を「帰無仮説」として設定する。「検定」で証明したいのは、「帰無仮説」の否定形である「対立仮説」。
(2)帰無仮説が従う「統計分布」を定義する。
(3)与えられたデータが、(2)の統計分布に従った場合に起こる確率を計算する。←エクセルや統計ツールはここを計算。
(4)その確率が「有意水準」とか「信頼区間」と呼ばれる判定基準を超えるかを判定する(「有意水準」の範囲に入る、あるいは「信頼区間」を外れる)。
(5)(4)で判定基準を越えたら「与えられたデータはめったに起こらない」「それが起こるには何らかの理由・意味がある(=有意)」として、(1)の「帰無仮説」が否定され、「対立仮説」が採択される。
もし(4)で判定基準を越えなかったら、帰無仮説は否定できないので「対立仮説」は証明できない。つまり検定に失敗。
エクセルの関数やツールを使うのは(3)の部分だけなので、「検定をどのように行うのか」という知識なしには、ツールだけ使えても実際の検定の作業は行えません。
結局のところ、「検定」とは「命題」を論理的に「証明」あるいは「否定」する作業であり、その判定条件として「統計的数値」を使うだけです。従って、「命題」の中身や、どうすれば「証明」「否定」できるかという戦略を立てられなければ、ツールを使えるだけでは全く歯が立ちません。
「受験したい会社の説明会」で話した人も、そういう「裏」まで精通していることを期待しているのですよ、きっと。
ご参考まで。
きっとそうなのでしょうね。
結局のところすべて理解してないと困るという意味だろうなと思って、「関数が何をしてくれているのか知らないまま使うのは不安、どういうもので何をしているのか知りたい」と書きました。関数を覚えたくらいで受験しても、勉強しましたなんてアピールはできません。
とりあえずはサイトで勉強して、不安なところを本で補強したいです。
No.4
- 回答日時:
No.1です。
>受験したい会社の説明会で、excelでt検定とF検定ができると助かる、と言われたため学習したいと考えました。カイ2乗検定については触れられていないので、わかりません。
だったら、今は「統計の基礎の勉強」をしておいて、会社に入ってから、やりたいことに応じて Excel なり統計ツールを使って、必要な精度で検定作業を行えばよいのではないでしょうか。
「とりあえず使える」状態で入社しても、様々な応用問題やニーズには応えきれないと思います。「得られた結果をどう評価するか」とか、やりたいことに対する「適用の限界」とか「そこまでは無理」という判断も求められると思いますので。
そういったニーズに応えるには、生半可なテクニックではなく、しっかりとした「基礎」「基本」ができている方が役に立つと思います。
全くの「統計初心者」なら、とりあえずNo.1に挙げた「ハンバーガー統計」などで「イメージ」をつかんで、下記のような本を読んでみてはいかがでしょうか。
↓ 統計の考え方を独習するには。ただし「検定」の話の入口まで。
https://www.amazon.co.jp/%E5%AE%8C%E5%85%A8%E7%8 …
↓ 検定まで、一通り「考え方」と「数学的記述」を知りたいなら。
https://www.amazon.co.jp/%E3%81%BE%E3%81%9A%E3%8 …
その他、レベルに応じていろいろな本が出ています。
No.3
- 回答日時:
あー、ちなみに。
Rを使って「統計学そのものを勉強したい」のなら、次のPDFが良いと思います。
Rによる統計解析の基礎:
http://minato.sip21c.org/statlib/stat-all8th.pdf
これ一冊やっておけば、ある程度の統計学の基本は身につくんじゃないでしょうか。
参考までに。
No.2
- 回答日時:
余談ですが。
ぶっちゃけ、Excelは統計用ソフトではないです。表計算ソフトです。
従って、統計関数の精度に対してはかなり疑問があります。
統計解析用ツール、Rを使いましょう。
Rのインストール:
http://www.okadajp.org/RWiki/?R%20のインストール
使い方は次のPDFなんかに書いてあります。
統計用言語Rの使い方:
https://www.library.osaka-u.ac.jp/doc/TA_2014_01 …
R基本統計関数マニュアル:
https://cran.r-project.org/doc/contrib/manuals-j …
上にもRStudioと言うのが紹介されていましたが、他にもGUIのRコマンダーと言うライブラリがあります。
Rコマンダーの説明書:
http://www.cwk.zaq.ne.jp/fkhud708/files/R-comman …
Rコマンダー入門:
http://www.ec.kansai-u.ac.jp/user/arakit/documen …
R Commander を用いたデータ解析:
http://www.josai.ac.jp/~nagasima/contents/doc/rc …
Rコマンダー入門:
https://r-forge.r-project.org/scm/viewvc.php/*ch …
もちろん、エクセルからデータも読み込めるので、エクセルで作成したデータをRコマンダー等を経由して解析すれば一番手間がかからないでしょう。
ありがとうございます。
そうですね、excelは統計ソフトではないですし、元はシミュレーションソフトとしての意味合いが強かったとも聞きます。
しかし今回はexcelでやる必要があるのです。
今回学びたいと思ったきっかけが、受験したい会社の説明会で、excelでt検定F検定ができると助かる、と言われたことでした。統計ソフトを使えるといい、ではなく、excelで、とのことでしたので、残念ながらRを学習しても使う機会はなさそうですが……pdfは読んでいてとても勉強になりました。
No.1
- 回答日時:
なぜ「t検定」と「F検定」なのですか?
「カイ2乗検定」は必要ないのですか?
「手法ありき」ではなく、「何をしたいのか」から始めるべきでしょう。
なお、高校数学では「t検定」や「F検定」、そのベースとなる「t分布」や「F分布」は履修しません。
勉強したいなら、「統計学」の本を読む必要があります。数学的には、高校の数Ⅰ・数Aレベルで大丈夫だと思います(多分、中学レベルで大丈夫)。
(1)「t検定」の基本となる「t分布」は、多くのデータの「母集団」から、数少ないサンプルを取り出したときに、そのサンプルが従う分布です。
つまり、「数少ないサンプルから、未知の母集団の平均値やバラツキぐあいを推定する」ときに使います。
「検定」としては、「このサンプル、本当にその母集団から取ってきたの?」を調べるものです。
(2)「F検定」の基本となる「F分布」は、2つのグループの標準偏差の比の分布です。
つまり、「2つのグループのバラツキぐあいを比較する」ときに使います。
「検定」としては、「この2つのグループ、本当に同じバラツキぐあいなの?」を調べるものです。現実にはあまり使いません。
(3)もうひとつ、上記の2つ以上によく使うのが「カイ2乗検定」です。
「t検定」と「カイ2乗検定」は、下記の通称「ハンバーガー統計」というサイトに載っていますので、興味があれば見てみてください。詳しく知りたければ、きちんとした本を勉強した方がよいと思います。
http://kogolab.chillout.jp/elearn/hamburger/
↓「カイ2乗検定」
http://kogolab.chillout.jp/elearn/hamburger/chap …
↓「t検定」
http://kogolab.chillout.jp/elearn/hamburger/chap …
ありがとうございました。
>なぜ「t検定」と「F検定」なのですか?
「カイ2乗検定」は必要ないのですか?
「手法ありき」ではなく、「何をしたいのか」から始めるべきでしょう。
↓
受験したい会社の説明会で、excelでt検定とF検定ができると助かる、と言われたため学習したいと考えました。カイ2乗検定については触れられていないので、わかりません。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
有意差検定
-
片側と両側の判断について(統計学)
-
統計のχ2乗検定について教えて...
-
Excelによるχ自乗検定 0で除...
-
確率密度関数が対称であるかど...
-
決定係数がマイナスになる例っ...
-
統計問題
-
149cmと177cmの差ってこんなも...
-
サンプル数の違うものの比較
-
回帰式と近似式について
-
罰則付き回帰スプライン?について
-
相関係数と有意差
-
切片あり回帰と切片なし回帰
-
原点強制通過させたときの相関係数
-
相関の表現について(高い、強い?)
-
SQLの副問い合わせと相関副問い...
-
影響の大きさを統計学的に計算...
-
確率の問題について
-
有意水準の求め方がわかりません。
-
修正済み決定係数(R2乗)がマ...
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
有意に大きい(小さい)とは?
-
Excelによるχ自乗検定 0で除...
-
パーセンテージのカイ二乗検定...
-
統計のχ2乗検定について教えて...
-
t検定・F検定の勉強方法
-
片側検定ってずるくないでしょ...
-
ピアソンの相関係数に有意性が...
-
【統計学】区間推定の際のεとε/...
-
2群間の検定について
-
片側と両側の判断について(統計学)
-
統計 片側p値の考え方
-
多変量分散分析(MANOVA)
-
新指導要領における高校数学の...
-
適したdescriptive techniqueと...
-
多変量解析と検定の違いは?
-
二つのデータの波形が似てるか...
-
決定係数がマイナスになる例っ...
-
切片あり回帰と切片なし回帰
-
回帰式と近似式について
-
相関係数Rの2乗について
おすすめ情報
excelでt検定F検定ができると助かる、と言われて勉強をはじめようと思いました。
それで何をするのかは聞かされておりません。