比较两个向量的FDR

时间:2013-06-08 10:38:33

标签: r p-value fdr q-value

我们给出了一个包含2列(样本,实验条件)和 n 行(例如基因)的矩阵,我们的目标是识别已经发生显着变化的基因(在特定的FDR)两个样本之间。

如何使用R执行此操作?

以下是fdrtool包装手册中的示例,其中显示了如何从p值向量计算FDR:

library("fdrtool") 
data(pvalues)
fdr = fdrtool(pvalues, statistic="pvalue") 
fdr$qval # estimated Fdr values 
fdr$lfdr # estimated local fdr

但问题是我们这里只有两个观测向量,而不是p值。有什么想法吗?

以下是可以使用的示例数据:foo <- matrix(runif(1000), ncol=2)

我认为我们没有复制信息,p值等。但是可以肯定的是,两个样本之间具有不同值的基因肯定有更强的证据。有没有办法在这种情况下分配FDR?

1 个答案:

答案 0 :(得分:1)

如果每个条件都有一个样本,则无法获得p值,因为这是为一个群体绘制的样本之间的差异在统计上不同的概率。但是,如果你没有重复,没有平均值,没有每个基因的方差,正如我所理解的那样,我们无法估计抽样误差,因此没有如何区分你看到的随机值的值,对于传统的测试小样品,作为t检验。看看这个,它可能会有所帮助:

http://en.wikipedia.org/wiki/P-value

http://www-stat.stanford.edu/~tibs/SAM/

你能做什么,是一个MA情节

http://en.wikipedia.org/wiki/MA_plot

并查看数据的分布,这些差异很大,并选择那些。但是,这不是虚假发现率分析的统计框架,它可能有助于作为探索性分析,但没有真正的统计数据。在微阵列的文献中,您可能会找到替代方案,做出一系列假设并进行假设检验,但我不知道有人指出,也许这个包装有一个......

enter image description here