【あるあるbot連動企画】あるあるbotに投稿したけど採用されなかったあるある募集

統計、特に医学統計に詳しい方、お願いいたします。
ある腫瘍が体表にできた場合の統計処理を考えております。
1.n=23 で女性17人  男性6人でした。
  この場合、腫瘍の発生の男女に有意差があるか知りたいです。
  どういった処理を行えばよいでしょうか。

2.この腫瘍のうち、良性と悪性があります。
  悪性と良性の割合はそれぞれ
  女性  悪性2人   良性15人
  男性  悪性4人   良性2人

 でした。
悪性腫瘍の発生率に男女差がありますでしょうか。
また、この際に使用する統計処理を教えていただけますでしょうか。

全くの統計素人で計算方法、出てきた数字の解釈を合わせて教えていただければありがたいです。
厚かましいお願いですが、どうかよろしくお願いします。

A 回答 (5件)

#2です。


Rのスクリプトを載せておきます。

rm(list=ls())
#
# 2次データを使用したt検定(関数として定義)
#
two.value.t.test <- function(
n1, # 第1群のデータ個数
m1, # 第1群の平均値
v1, # 第1群の不偏分散
n2, # 第2群のデータ個数
m2, # 第2群の平均値
v2, # 第2群の不偏分散
key) # TUREならウェルチ
{
if(key){
# ウェルチの方法を使う場合
method <- c("Welch Two Sample t-test")
c <- (v1/n1)/(v1/n1+v2/n2) # 補正値
df <- 1/(c^2/(n1-1)+(1-c)^2/(n2-1)) # 修正自由度
tvalue <- abs(m1-m2)/sqrt(v1/n1+v2/n2) # 検定統計量
}else{
# 等分散を仮定して合併分散を用いる場合
method <- c("Two Sample t-test")
df <- n1+n2-2 # 自由度
v <- ((n1-1)*v1+(n2-1)*v2)/df # プールした不偏分散
tvalue <- abs(m1-m2)/sqrt(v*(1/n1+1/n2)) # 検定統計量
}
P <- 2*pt(tvalue,df,lower.tail=FALSE) # P値(両側検定)
names(tvalue) <- c("t")
names(df) <- c("df")
result <- list(method=method,statistic=tvalue,parameter=df,p.value=P)
class(result) <- c("htest")
return(result)
} # 関数定義終わり
#
# 分割表によるカイ2乗検定
#
x <- matrix(c(2,4,15,2),ncol=2)
chisq.test(x)
#
# 通常の母比率の検定
#
counter <- c(4,2)
total <- c(6,17)
prop.test(counter,total)
#
# 逆正弦変換を行った2つの母比率の差の検定(群間に違いがあるか)
#
n.male <- 2 # 良性と悪性の2水準
n.female <- 2
p.male <- asin(sqrt(4/6))
p.female <- asin(sqrt(2/17))
v.male <- 1/(4*(6-1)) # 不偏分散に
v.female <- 1/(4*(17-1))
#
two.value.t.test(n.male,p.male,v.male,n.female,p.female,v.female,TRUE)
    • good
    • 0

#2です。


・StatWorksという統計ソフトには、
「逆正弦変換による2つの母比率の差の検定」があったのですが、
データ数が少ないという警告が出て動きませんでした。
・少ないn数のときに有効な手法なのに、役に立たないソフトです。

・そこで、自分でRでスクリプトを書いてやってみました。

・逆正弦変換による検定とは、比率がpのときに、近似的に
正規分布、N(arcsin(√p),1/4n)に従うという性質を使って、
パラメトリックな検定を行う方法です。
・今回のように、2つの母比率の差の検定を行うときに、
分散がpに依存しない(1/4n)というのはありがたい性質なのです。

・結果を示します。

・まずは、#1さんが提案された2×2分割表による適合度検定をやってみましょう。
・Rのchisq.test()で実施できます。
・男女差があるか、が知りたいので両側検定になっています。

> #
> # 分割表によるカイ2乗検定
> #
> x <- matrix(c(2,4,15,2),ncol=2)
> chisq.test(x)

Pearson's Chi-squared test with Yates' continuity correction

data: x
X-squared = 4.3777, df = 1, p-value = 0.03641

警告メッセージ:
In chisq.test(x) : カイ自乗近似は不正確かもしれません

・p=0.03641 より、5%有意です。
・少数データのため、χ^2値が怪しいという警告が出ました。
・つまり、差が有意というのは、あまり正しくない結果です。

・次は、一般的な2つの母比率の差の検定です。
・Rのprop.test()で実施できます。

> #
> # 通常の母比率の検定
> #
> counter <- c(4,2)
> total <- c(6,17)
> prop.test(counter,total)

2-sample test for equality of proportions with continuity
correction

data: counter out of total
X-squared = 4.3777, df = 1, p-value = 0.03641
alternative hypothesis: two.sided
95 percent confidence interval:
0.02917114 1.00000000
sample estimates:
prop 1 prop 2
0.6666667 0.1176471

警告メッセージ:
In prop.test(counter, total) : カイ自乗近似は不正確かもしれません

・結果は、p=0.03641 より、上と同じです。
・男女差があるか、より両側検定になっています。
・少数データのため、χ^2値が怪しいという警告が出ました。
・やはり、あまり正しくない結果です。

・最後は、逆正弦変換によるt検定です。
・スクリプトは、次の回答に示します。

> #
> # 逆正弦変換を行った2つの母比率の差の検定(群間に違いがあるか)
> #
> n.male <- 2 # 良性と悪性の2水準
> n.female <- 2
> p.male <- asin(sqrt(4/6))
> p.female <- asin(sqrt(2/17))
> v.male <- 1/(4*(6-1)) # 不偏分散にする
> v.female <- 1/(4*(17-1))
> #
> two.value.t.test(n.male,p.male,v.male,n.female,p.female,v.female,TRUE)

Welch Two Sample t-test

data:
t = 3.3411, df = 1.569, p-value = 0.109

・ウェルチの方法を使って、合併分散を求めています。
・p=0.109より、有意な差ではないという結論が出ました。
・この結果は信じても良さそうな値ですね。
    • good
    • 0
この回答へのお礼

ひどい質問内容にもかかわらず、大変丁寧にご回答いただき感謝申し上げます。統計を学びたいとは思っているのですが、幾度となく挫折しております。次回また機会がありましたら、もう少しましな質問ができるよう、勉強しておきたいと思います。本当にありがとうございました。重ねてお礼申し上げます。

お礼日時:2016/07/13 11:43

#2です。



質問1もありましたね。

1は、母数がないので、検定できません。

つまり、男女100人づつ調べて、17人、6人であれば
0.17と0.6の差の検定をロジット変換が逆正弦変換でやればOKです。
    • good
    • 0

企業で統計を指導する者です。


もし、社内の問合せであれば、次のように回答します。

#1さんのように、分割表の検定に持ち込むことを、すぐ思いつきますが、
これには、母集団が正規分布に従うという「前提」が必要です。
そこで、発表などでは、分割表の検定は使わない方が無難です。

次に考えられるのが、
・ノンパラメトリック分析に持ち込む。
・変換を掛けて、t検定や分散分析に持ち込む。
という2つの方針が立ちます。

ノンパラメトリックには検定力が低下するという弱点があるので、
後者を取ることにします。

この場合、二つの母比率の差の検定、
すなわち、腫瘍発生率、2/17、4/6の差を検定することになります。

ここで用いられるのが、
逆正弦変換という方法です。

たぶん、市販の統計ソフトであれば、処理してくれると思います。
(アークサインを使いますので、ここで電卓処理のようにはお示しできません)

今は自宅なのでできませんが、
必要であれば、会社で使用しているStatWorksというソフトに
この手法が入っていますので、やって差し上げます。
    • good
    • 0
この回答へのお礼

大変丁寧にご回答いただきありがとうございます。自分なりにやっていたら、大きな間違いをするところでした。また、大変ありがたいご提案をいただき感謝申し上げます。お言葉に甘えさせていただきたいと思います。よろしくお願いいたします。

お礼日時:2016/07/10 19:18

男性のサンプル少な過ぎるような気もしますが、、、


一般的には、カイ二乗検定を使います。
http://aoki2.si.gunma-u.ac.jp/lecture/Cross/Fish …
    • good
    • 0
この回答へのお礼

早々にご回答いただきありがとうございました。
質問2については、男に対して、良性 悪性 女性に対して良性 悪性の2×2の票を作ればよさそうだということは理解できたいのですが、質問1の、すでに発生した腫瘍の男女差を見るためにはどのように検定すればよいのでしょうか。統計の基本的なことかもしれませんが、そこら辺から理解ができていないのです。申し訳ありません。もう少し詳しく解説いただけますと大変助かります。

お礼日時:2016/07/09 08:39

お探しのQ&Aが見つからない時は、教えて!gooで質問しましょう!