我在分析我的RNA-seq数据时遇到了问题。我有三个tratments(对照,D1和D2),并且在每个tratment中我计算两组之间的DE基因(G1和G2)。然后我确定了与对照相比在D1和D2中成为DE的基因。总结一下,我(见图1):
现在我想了解这种重叠是否是偶然的。所以我想对我的解决方案有一个反馈,如果错误的话,我可以回答一下我的问题。
我有我的观察:在D1和D2共有的1,000个DE基因中,有50个重叠。然后,我从D1和D2中抽取100个基因,我计算了多少重叠(自举1000次)。让我们说自助绘图的结果是10.最后,我测试了观察到的重叠和通过随机绘制获得的重叠是否因超几何分布而不同。
我使用phyper
(link)完成了R的所有操作,如下所示:
这里我必须使用4个值:
x = 10 (overlapping genes from drawing)
m = 50 (overlapping observed)
n = 950 (total DE genes - m)
k = 100 (number of genes drawn from D1 and D2)
lower.tail=FALSE
我得到0.007
,如果我理解正确并且我的程序也正确,则意味着我在D1和D2之间观察到的重叠不是偶然的。
关于我的做法的任何意见?
谢谢!