如何在GDS文件中进行R测试?

时间:2013-03-16 11:09:55

标签: r

我的项目是关于预测生物标志物乳腺癌。

我用这个函数给我一个2x2矩阵:

Table(gpl96)[1:10,1:4]

我想获取代表GDS中基因样本的数据,并比较p值以了解它是否正常分布。

1 个答案:

答案 0 :(得分:0)

t.test测试两个样本之间是否存在符合正态分布的位置差异。

要近似检查假设的正态性,您可以检查qqnorm的输出是否呈线性,或者将ks.test与估算参数*一起使用*:

set.seed(1)
x1 <- rnorm(200,40,10) # should follow a normal distribution
ks.test(x1,"pnorm",mean=mean(x1),sd=sd(x1)) # p: 0.647 [qqnorm(x1) looks linear]
x2 <- rexp(200,10) # should *not* follow a normal distribution
ks.test(x2,"pnorm",mean=mean(x2),sd=sd(x2)) # p: 3.576e-05, [qqnorm(x2) seems curved]

我不知道GEO Table,但我建议你可能想要使用VALUE列 - 而不是任何2x2矩阵 - 作为t.testqqnorm的输入或ks.test;也许您可以通过发布head(Table(gpl96)[1:10,1:4])的输出来提供一些额外的数据说明。

(* https://stat.ethz.ch/pipermail/r-help/2003-October/040692.html之后,这似乎也证明了更精致的Lilliefors测试。)