電子書籍の厳選無料作品が豊富!

A群とB群のデータ(パーセンテージ)の平均を比較する時、
2標本なので、その検証はt検定で良いのではないかと考えましたが、
通常は(テストの点数など)数値の平均値であるところが
パーセンテージですので、本当にt検定で可能なのかどうか心配です。
お分かりになる方、ぜひご教示くださいませ。

A 回答 (7件)

パーセンテージもテストの点数も同じ。


テストの60点は100点満点なら60%。
    • good
    • 0

総和をN数で割るために、計数値の総和を取るということ自体、ポアソン分布仮定なんです。



計数値は、負値は取らない、0の時にはバラツキはない、という性質があるからです。

アクセス数とか、工業では工程間の中間バッファとか。これらの全体に占める割合を出すために総和を取ることが該当します。

これは日毎の平均(ポアソン平均)を出すために総和を取ったのと同じです。

おっしゃるように、何ら問題ないです。
    • good
    • 1
この回答へのお礼

ありがとう

お礼日時:2024/08/16 15:35

No.4です。



まだ、閉じていらっしゃらなかったんですね。

ご質問者は、初学者のようですから、ここで述べることは余計なことかもしれませんが、老婆心ながら、ご質問者が恥をかかないためにと思いまして・・・。

~~~~~~~~~~~~~~~~~~~~~~~~~~

パーセンテージの値って、比の値ですよね。
本来、比の値には加法性はありませんので、平均は取れません。

例えば、行きの時速と、帰りの時速を足して2で割っても平均時速にならないことは、小学生でも知っていますよね。

だったら、平均歩留まりとか、平均効率とか、工業的に用いられる平均値を使っているヤツらは小学生以下の連中かよ。と思われるかもしれません。

公示される「土地の平米単価」なども比の値ですが、算術平均が使われますよね。政府って小学生以下かよ、と思ったりしませんか?

そうではない理由と、それに当てはまらない時の対処法を示しておきます。

①歩留まりや効率などの、元の値がポアソン分布に従う「観察される現象」のとき、このケースでは「ポアソン平均λ」を用います。
ポアソン平均は算術平均に等しいです(今回はここがミソです)。
平米単価はポアソン分布に従っているので、問題ありません。
注意しなければならないのは、分散もλになることです。
ただ、n=10程度のサンプルであれば、偏差平方和から求めた分散を使っても良いです(あまり変わりません)。

②時速や、工数(1人1時間あたりの生産台数)の平均をとるときは、「調和平均」を使います。
「全体のエネルギー収支を一致させたい」ときは、調和平均を用いることは必須です。

③その他の比率の場合(例えばSN比のような「物理量」の場合(観察される現象ではなく))、対数値を用いてその平均を取ると解決する場合があります。
対数加法性という性質を用います。
元の値の「幾何平均」を使っているのと同じです。
元の分布が対数正規分布に従うことが多いです。
    • good
    • 0
この回答へのお礼

ご丁寧に有難うございます。
私はご推察のとおり初学者ですが、さすがにパーセンテージの各値をそのまま使って平均はとっておらず、すべて数値を足してN数で割る算術平均をとっていました。
観測された現象ではない調査結果(数)ですが、これはこれで良いと考えています。

お礼日時:2024/08/16 11:26

No.4です。



> サンプルがいくつもある場合は、パーセンテージの平均値の比較であっても、t検定で良いのですね。

はい。計数値であっても、それがいくつもある場合は、計量値扱いします。

工業的な事例で言うと、「1日の歩留まり」などが挙げられます。
1日あたり500台前後生産していても、ここでは生産数量は関係ありません。その日の歩留まりだけがデータで、10日分のデータがあるときのn=10がサンプルサイズとなります。

つまり、ある製品の治具交換前の歩留まり10日分と、交換後の歩留まり10日分のデータがあって、治具交換後に歩留まりが改善したか、歩留まりの平均の差を検定したいとき、母分散未知であれば平均値の差のt検定を行います。

もちろん、母分散既知のときはz検定になります。

さらに、治具交換前後で分散が違う場合は、ウエルチの検定になります。

歩留まりが0や1に漸近する時は(それぞれに0.05以内で近い時)は、歩留まり値をロジット変換や逆正弦変換をしないと、正しい結果が得られません。
この理由は、0や1に漸近する箇所では分布が左右非対称になるので、正規分布に近似できないからです。
数値変換することによって、尺度がほぼ等尺になり正規分布近似が可能になります。
    • good
    • 0

No.3です。



テストの点数(計量値)で、サンプルがいくつもある場合は、t検定になります。このケースは、たとえ0~100の範囲しかとらない値であっても、強引に正規分布に近似して、検定を行います。

パーセンテージとは、何個中何個生起したか、という計数値の場合になります。
    • good
    • 0
この回答へのお礼

サンプルがいくつもある場合は、パーセンテージ(何個中何個生起したか)の平均値であっても、t検定で良いのですね。ありがとうございます。

お礼日時:2024/08/14 20:13

t検定は使いません。



二つの母比率の差の検定

これは、標本標準偏差を使用しないので、ステューデントのt分布にはなりません。直接正規分布に近似するため、z検定です。
    • good
    • 0

テストの点数って、言い換えれば「そのテスト全体の何パーセントをクリアできたか」ってこと。

    • good
    • 0
この回答へのお礼

そういうことなんですね。ありがとうございます。

お礼日時:2024/08/14 20:10

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!

このQ&Aを見た人はこんなQ&Aも見ています


このQ&Aを見た人がよく見るQ&A