統計検定2級を学んでいるものです。
過去問で合格点を取れるようにまでは知識を身につけましたが。
母分散の検定→χ二乗検定
対応のない2標本の母平均の差の検定→z検定(プールした分散)
のようにケースバイケースで検定を選択はできるのですが、
何故χ二乗分布を用いるの?と聞かれたら
うーんという感じです。
その統計量が自由度n-1のχ二乗分布に従うからとういうような理解の程度なのですが、
そう言った深いところまで理解していないと
実践において使えない知識になってしまいますか?
A 回答 (5件)
- 最新から表示
- 回答順に表示
No.5
- 回答日時:
No.2へのコメントについて
> 社会に出て実践を積んでいく中で、培われるものでしょうか?
「社会に出て」って、先送りしてどうする。「もしかしたら仮定にムリがあるかもしれない」という問題意識を持った上で、自分でデータを集めて仮定を確かめながら解析する、ということをいくつかやってみれば、どこがムリそうかを嗅ぎつけられるようになると思う。まずは、条件を比較的コントロールしやすい物理実験でも良いんです。「あ、今の測定は失敗だからナシね」とやりたくなる誘惑の強さが実感できるでしょう。
もちろん、疑い過ぎて萎縮するようでは薬が効き過ぎってことですが。
No.4
- 回答日時:
#3です。
結果を疑うとは、「その結果は間違いじゃないの?」という疑いではなく、「なんでそうなったのか?メカニズムは合ってるの?」という「従来の知見、あるいは固有技術と照らして整合しているか?」という疑いで、前向きな姿勢です。
盲目的に信じるのではなく、エビデンス(証拠)を求めるということです。
あるいは、実態と異なるのであれば、「どこで違ってきたのか」を明確化することです。
データサイエンスも同じで、企業では数学だけやってきたデータサイエンティストを採用するのではなく、製品設計や品質保証で実績を積んだ技術者に対してデータサイエンスを教えるというリスキリングを進めています。
これも、現実での再現を重視しているからです。そのセンスは実務者には豊富にあります。
大学生であれば、インターンシップとか企業との共同研究に参加して、実践の場で繰り返し精度や再現性について学ぶと良いと思います。
No.3
- 回答日時:
>実践において使えない知識
深いところまで理解するというのが、手法を全て知っていて使いこなせるということですと、違うと思います。
サンプリングされた少数のデータから良し悪しを決める時、見誤るというケースが多々あります。その統計上のリスクをどれだけ分かっているかが「理解」だと思っています。
(リスクとは、例えば3大バイアス(サンプルセレクションバイアス・削除変数バイアス・内生性バイアス)などです)
私は企業人ですが、企業の統計屋は、教科書に書いてある基準はおおむね守りません。常に安全側安全側に考えます。
例えば、p値を計算して閾値以内であれば棄却されずに「差があるとは言えない」と結論付けるのではなく、ギリギリであれば(少しでも疑わしければ)、必ず「n増し」して違う側面から検討を加えます。
(同じ検討を行うときは多重比較に要注意)
実践において使える知識とは、統計上の結果を疑う知識だと思います。
No.2
- 回答日時:
使えないのならまだ良い。
誤った使い方をしてトンデモな結論を引き出したりする。だったら、統計など知らない方がマシです。「どんな実験でどんなデータをどうやって取るか」というところを考えずにただ数値しか見ないとか、「リクツはともあれ、気に入った結論が出てくれればOK」とか、アルアルです。
むしろ「統計のコマカイことは知らんけど、でも、これっぽっちのデータで(or こんな調査・実験で)そんなことまで分かっちゃうのって、オカシクない?」と疑うセンスの方が、実践ではよほど重要。たとえばデータが100個しかないのにp値を有効数字5桁も書いたりするのは、どこか肝心なところがヌケてるんです。
「現実の世界でデータを取って、数学の確率論の言葉で議論する」というのが統計です。このとき、数学にとっては現実がどうなってるかなんて知ったことじゃないんで、扱おうとしている現象に確率論が適用できるかどうかは保障してくれない。言い換えれば、「現実の対象と数学の対象というまるで別物同士を同一視しよう」ということをやるんです。だから、現象が何らかの
> 分布に従うから
と言うためにどんな仮定が置かれているか、また、使っている技法がその仮定にどのぐらい敏感なのか、そして、実験がその仮定をどの程度の精度で満たしていると信じられるか、ってことが肝心。
キチンとした教科書の例題・練習問題や検定試験問題では、この仮定を全くスットバスような迂闊なことはしませんが、「ある仮定が絶対成り立っている」ということをサラリと前提する。そうしなきゃ話が進まんわけですが、しかしこれは統計を学習している人に「仮定に鈍感になる癖」をつけることになる、という弊害がありそう。
そういうような疑うスキルはやはり社会に出て実践を積んでいく中で、培われるものでしょうか?
私は大学生でデータサイエンスに興味があるので、統計学を勉強し始めたのが背景なのですが、
stomach manさん以外にも
疑うセンスが大事と言っていますが、
なかなか過去問や参考書を読むだけじゃ
培われませんよね。、。
No.1
- 回答日時:
>そう言った深いところまで理解していないと
実践において使えない知識になってしまいますか?
はい。そうです。
それは「それがどんな分布に従っているのか」「その分布を使って何をするのか」という基本的な戦略を理解できていないということですから。
「それがどんな分布に従っているのか」は理解してます。
「その分布を用いて何をするのか」は
統計量(z値)などを計算して、それらが分布のどの点を指していて、定められた有意水準においてp値がいくらになるか
棄却するか受容するか判断する
という認識だけでは不十分ですかね。。。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 統計学 統計学を学んでいるものです。 区間推定や検定において度々 t分布やカイ二乗分布、F分布が現れますが、 6 2023/02/15 14:26
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 母平均の検定(両側t検定)の問題 2 2023/03/14 20:02
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 統計学 統計学の質問【帰無仮説】 昨年度のA大学卒業者の平均初任給(月額・万円)について調べるために、昨年度 1 2023/05/25 23:30
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 t統計量とF統計量について 9 2023/01/05 14:23
- 統計学 QC検定での質問です。 正規分布の平均の検定統計量で、分母のσと√σ二乗とふたとおり記載があります。 2 2023/08/10 15:55
- 統計学 統計学の質問【帰無仮説】 B大学の卒業生の平均年収について調査するため、100人の卒業生を無作為に選 1 2023/05/25 23:36
- 統計学 統計学の質問【帰無仮説】 大学で、現在の在籍者の平均通学時間が60分であるという帰無仮説を、それが6 8 2023/05/23 20:56
おすすめ情報
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
統計学の基本的なことについて...
-
EXCELにてローパスフィルタを作...
-
検量線の決定係数について
-
心理機能診断をしたのですが、...
-
サンプル数の異なる2群間にお...
-
エクセルのグラフから半値幅を...
-
下の対数表示のグラフから低域...
-
最小二乗法を反比例の式を元に...
-
溶解度の問題 理科
-
心理学の統計について
-
死傷者数と死者数の違いって何...
-
v-xグラフのようなものは描けま...
-
検定統計量の値がマイナス
-
統計について
-
z値p値とはなんですか?
-
【統計】有意に「高い」?「低...
-
統計学のサンプル数2000の根拠は?
-
理科のグラフで、直線と曲線の...
-
相関係数
-
母比率の差の検定の英語名
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
EXCELにてローパスフィルタを作...
-
サンプル数の異なる2群間にお...
-
心理機能診断をしたのですが、...
-
エクセルでランダム関数で乱数...
-
ブラック・ショールズ方程式を...
-
複数の集団の全体平均が0より有...
-
検量線の決定係数について
-
ポアソン回帰でのカウントデー...
-
青い下線部分はなぜそうなるの...
-
統計学の問題でわからないので...
-
[Excel] リストからの無作為抽出
-
x^2+y^2はどのような分布をする?
-
エクセルのグラフから半値幅を...
-
統計について
-
極値をもつ時と持たない時、単...
-
エクセルで正規分布かどうかを...
-
パイロットサンプルって何ですか?
-
データが正規分布しているか判...
-
回帰分析の回帰係数のt検定
-
正規分布について
おすすめ情報