
まず、私が今、行おうとしている検定の仕方をご説明します。
1. 非常に時間のかかる測定結果が数件あり、そのうちの1件(標本A)が平均から大きく外れた値を示しています。おそらく測定時になにかの外乱があり、このような値を示したのでしょう。原因を追求するのは、困難なのでこの値をすててしまいたいところです。
2. そこで平均、分散、標準偏差を計算しました。***
3. 標本が正規分布をなすことを仮定して、標本Aよりも大きな平均よりのずれを示す確率を正規分布確率表で確認したところ、16%と出ました。
4. と、いうことはそのような値が生じる確率は16%ある訳で、この値を捨てるのは適切ではない。うーん。残念。←今、ここ。
さて、お聞きしたいのは***の部分です。
今回の場合、この異常値・標本Aを平均、分散、標準偏差の計算に用いることで、大きくこれらの値が変わってしまっています。
たとえば、標本Aを取り除いた上で、平均、分散、標準偏差の計算を行ってみると、標本Aの値が生じ得る確率は0.04%になります。ということはなにか変なことが起こったんだろうね、ということでこの値は捨てていいことになると思います。
しかし、異常値かもしれない値を、最初から取り除いて(つまり特別扱いして)行う検定というのもなんだか、ズルをしているようで変な気がします。
このような計算の仕方(検定の対象となる異常値をあらかじめ除いて検定を行うやりかた)は統計上、正しい手順なのでしょうか?
そもそも標本数が少ないときにはもっと別の手順で検定を行うべきなのでしょうか?
なにぶん、素人なので定義に反した用語の使い方をしているかも知れませんが、何卒よろしくお願いいたします。
No.2ベストアンサー
- 回答日時:
かけ離れた値を捨てる処方としては棄却検定があります。
http://www10.plala.or.jp/biostatistics/rejection …
http://www1.doshisha.ac.jp/~kibuki/computer/resu …
などをご参照下さい。
No.3
- 回答日時:
指導者に相談すべき
「捨てろ」と言われたら、2度と相談してはならない。
>非常に時間のかかる測定結果が数件あり、
あんたの勝手。そんなことにならいように、誰もが工夫をする。だから、そんな方法に不満なら、あんたが悪い、が私の感想。それしかないなら、誰もしないので、ノンビリの利点有り。
>この値は捨てていいことになると思います。
絶対に駄目。読むだけで不愉快。私の学生なら、怒鳴りつけて永久追放。
都合の悪いものを隠すのは、政治家と官僚。統計学以前の科学をする資格なし。
バレルと一生信用ゼロ。学会では、誰にも相手にされない人を知っておる。
捨てていいのは、
1 棄却検定後
2 操作などの明確な誤り。
1)検定法を考え直す
2)全てやり直す、が基本。
この回答への補足
私は政治家でも官僚でもありませんが、科学者でもありません。
本文でもお分かりのとおり、統計についてもシロウト同然の知識しかもたないので、残念ながら「棄却検定」という言葉を知りませんでした。
ちなみに、私が携わっている業務では、測定対象に外乱が生じないために業界の水準を大きく越える工夫を凝らしておりますが、それでもなお、私が今回見たような「未知の異常な条件によると思しき、ヘンな値」を見ることはあります。大学の研究室ではどうか知りませんが、測定にかかるコストをいかにして安全に抑制するかは産業的には重要なことです。
>指導者に相談すべき
>「捨てろ」と言われたら、2度と相談してはならない。
おやおやおやおや。

No.1
- 回答日時:
例えばある点の位置を測定して中心位置を決める場合、大きく外れた測定点に測定で生じた偶然の擾乱以外に特別に注目する理由はないので、そのような点は切り捨てます。
一般には全ての測定の平均を中心としてある半径をカットオフ半径とし、その外にある測定点を切り捨てて平均を計算しなおす、という手順を収束するまで繰り返します。振動する場合は適当に打ち切ります。しかし、測定の擾乱要因を充分調べたにもかかわらず、そのように外れる点が生じる擾乱はないと高い信頼度で結論できるときには、その測定値を捨てるかどうかは、測定の目的によります。性質の良く知られていないある未知の量を推定したいために行った場合は、上記の単なる中心位置を決めるような良く知られた性質の量の決定とはまた異なる取り扱いが必要とされます。例えばある分子の未知の相互作用の準位間遷移の寿命を測定するような場合、複数のピークを持ち、指数関数の重なりのような裾を引く分布を示す場合があり、標本数が少ないと主要なピークから大きく外れたところに少数の測定点が得られますが、これを除いて考えたり含めて考えたりするには分布に対する理論的考察が必要とされ、個々の測定点を論じる必要があるでしょう。
要するに統計的検定はあくまで推論のための手段であり、それを適用するには測定の目的にかなうように行う必要があってそれによって何が正しいかが変わってくる、ということです。機械的な検定手順の適用は意味が無い以上に危険です。
質問内容の測定に関する詳細が不明ですので、一般的になってしまいましたが、以上の点に気をつけられると良いでしょう。
回答&アドバイスありがとうございます。
今回の場合、測定対象の性質は一応、正規分布をなすと期待していい理由がありますので、個々の測定点を論じる必要はないと判断しています。
お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!
似たような質問が見つかりました
- 大学・短大 大学 統計学 1 2022/09/14 11:27
- 統計学 確率統計の問題です。 3 2022/04/07 04:39
- 統計学 統計学の問題です。教えてください(_ _) 数万人の有権者がいる選挙区で, 無作為に400人の標本を 2 2023/02/03 15:27
- 統計学 統計学の問題です。よろしくお願いします。 ある部品の重量は正規分布に従うとされており,過去の経験から 1 2023/01/19 03:36
- 統計学 t値の計算方法 1 2022/11/29 18:37
- 統計学 統計学が分かりません!詳しい解説と回答を教えてくださる方お願いいします! 5 2022/08/23 03:10
- 統計学 母集団分布を平均 μ, 分散 σ2 の正規分布と想定し, 母集団から無作為抽出した標本のデータ(標本 4 2023/01/30 20:25
- 統計学 不偏分散について 3 2022/03/29 15:57
- 統計学 統計学の問題です よろしくお願いします 区間推定 母集団は正規分布に従い,母分散は σ2 = 112 1 2023/01/31 18:57
- 統計学 生物統計学の質問 7 2022/05/17 13:59
このQ&Aを見た人はこんなQ&Aも見ています
おすすめ情報
このQ&Aを見た人がよく見るQ&A
デイリーランキングこのカテゴリの人気デイリーQ&Aランキング
-
誤差について教えてください、...
-
低圧絶縁抵抗測定について教え...
-
計算がわからない
-
N増しとは?
-
管理値、管理基準値、規格値の...
-
「体重をはかる」は量る?測る?
-
トランスに繋がっている配線の...
-
誤差の範囲とは一体どういう意...
-
新規に購入した測定機器の校正
-
射出成型機の射出圧力はどこで...
-
開平演算
-
繰り返し測定 3回 の意味
-
はかりの上に物を置くと
-
XPSとAESどのような場合にどち...
-
インクの比重につきまして
-
設備管理初心者です。電気に詳...
-
A特性,F特性による音圧・騒音...
-
電流計(電圧計)の測定レンジと...
-
サーモカップルゲージとピラニ...
-
進相コンデンサの静電容量について
マンスリーランキングこのカテゴリの人気マンスリーQ&Aランキング
-
低圧絶縁抵抗測定について教え...
-
計算がわからない
-
誤差について教えてください、...
-
N増しとは?
-
「体重をはかる」は量る?測る?
-
管理値、管理基準値、規格値の...
-
繰り返し測定 3回 の意味
-
誤差の範囲とは一体どういう意...
-
はかりの上に物を置くと
-
トランスに繋がっている配線の...
-
熱を『はかる』の漢字を教えて...
-
新規に購入した測定機器の校正
-
開平演算
-
0の有効数字
-
ヒストグラムの区間の幅について
-
メガ(絶縁抵抗)の測定方法について
-
同軸ケーブルの劣化診断について
-
表面粗さ RaとSa の数値が大幅...
-
機械計測 (三次元や真円度) に...
-
進相コンデンサの静電容量について
おすすめ情報