比较基因表达重叠与超几何分布

时间:2018-04-12 18:29:35

标签: r

我在分析我的RNA-seq数据时遇到了问题。我有三个tratments(对照,D1和D2),并且在每个tratment中我计算两组之间的DE基因(G1和G2)。然后我确定了与对照相比在D1和D2中成为DE的基因。总结一下,我(见图1):

  • 代表整个转录组的15,000个基因
  • 1,000个基因代表那些成为DE作为治疗效果的基因,过滤那些在对照中的DE。该组被制成D1和D2 DE基因的联合,分别为450和600个基因。
  • 将DE基因相交,我发现它们中的50个对D1和D2都是共同的,400个特异于D1,550个特异于D2。

Fig 1

现在我想了解这种重叠是否是偶然的。所以我想对我的解决方案有一个反馈,如果错误的话,我可以回答一下我的问题。

我有我的观察:在D1和D2共有的1,000个DE基因中,有50个重叠。然后,我从D1和D2中抽取100个基因,我计算了多少重叠(自举1000次)。让我们说自助绘图的结果是10.最后,我测试了观察到的重叠和通过随机绘制获得的重叠是否因超几何分布而不同。

我使用phyperlink)完成了R的所有操作,如下所示:

这里我必须使用4个值:

x = 10 (overlapping genes from drawing)
m = 50 (overlapping observed)
n = 950 (total DE genes - m)
k = 100 (number of genes drawn from D1 and D2)
lower.tail=FALSE

我得到0.007,如果我理解正确并且我的程序也正确,则意味着我在D1和D2之间观察到的重叠不是偶然的。

关于我的做法的任何意见?

谢谢!

0 个答案:

没有答案