我使用edgeR和Limma包来分析RNA-seq计数数据表。 我只需要数据文件的一个子集,因此我的问题是:我是否需要在所有样本中规范化我的数据,或者最好先对我的数据进行子集化,然后对数据进行规范化。
谢谢。
关心Lisanne
答案 0 :(得分:0)
我认为这取决于你想要证明/展示的内容。如果你还想考虑你的“暗计数”,那么你应该首先将它标准化,这样你也会考虑实验失败的百分比。在这里,您的实验总数(好的和坏的结果)总计为一个。
如果你想找出你的“好事件”的分布,你应该首先制作你的好样本子集并在之后进行标准化。在这种情况下,您的好事件数量总计为1
所以再次,这取决于你想要证明什么。作为一名物理学家,我更喜欢第一种方法,因为我们不会删除不良数据点。
干杯TL