R标准化与所有样本,或只是我需要的部分?

时间:2013-06-06 13:18:51

标签: r dataframe normalization bioinformatics

我使用edgeR和Limma包来分析RNA-seq计数数据表。 我只需要数据文件的一个子集,因此我的问题是:我是否需要在所有样本中规范化我的数据,或者最好先对我的数据进行子集化,然后对数据进行规范化。

谢谢。

关心Lisanne

1 个答案:

答案 0 :(得分:0)

我认为这取决于你想要证明/展示的内容。如果你还想考虑你的“暗计数”,那么你应该首先将它标准化,这样你也会考虑实验失败的百分比。在这里,您的实验总数(好的和坏的结果)总计为一个。

如果你想找出你的“好事件”的分布,你应该首先制作你的好样本子集并在之后进行标准化。在这种情况下,您的好事件数量总计为1

所以再次,这取决于你想要证明什么。作为一名物理学家,我更喜欢第一种方法,因为我们不会删除不良数据点。

干杯TL