关于Volcano Plot的问题

时间:2011-01-20 02:45:53

标签: r statistics bioinformatics

我试图使用log2(比率)制作包含一些真实数据的火山图 与Z值显着性。然而,这些点的散射与“正常”的火山地块相比太少了,而且我得到了一个尖锐的“V”形图。

据我所知,如果同一X值的Y值不同,则会发生散射。但是我在这里缺少什么?

情节看起来很奇怪:http://img402.imageshack.us/i/volcanoi.jpg/

数据(比率)可从pastebin或附件中获得: http://pastebin.com/m2Jss3qF

R代码:我在这里做错了吗?

data <- read.table("data.txt",header=FALSE)
ratio <- data$V1
ratio.mean <- mean(ratio)
ratio.sd <- sd(ratio)
ratio.log <- log2(ratio)
z <- (ratio-ratio.mean)/(ratio.sd)
z.sig <- 2*pnorm(-abs(z))
z.tsig <- 2*pt(-abs(z),df=length(ratio)-1) ## sig from t-dist

op <- par(mfrow=c(1,4))
plot(ratio.log,-log10(z.sig))
plot(ratio.log, -log10(z.tsig))
plot(ratio.log,z.sig)
plot(ratio,z)
par(op)

1 个答案:

答案 0 :(得分:1)

我对数据意味着什么以及为什么以这种方式生成p值感到困惑。

无论如何,火山图通常在x轴上具有折叠差异,在y轴上具有p值。你得到一个奇怪的形状,因为基本上你根据它与数据平均值的距离(有点奇怪)生成特定数据点的p值。

考虑高于平均值的数据。随着数据点越接近平均值,相关的p值单调增加。相反,倍数变化也单调减少。