应用错误收集

时间：2013-06-06 13:18:51

标签： r dataframe normalization bioinformatics

我使用edgeR和Limma包来分析RNA-seq计数数据表。我只需要数据文件的一个子集，因此我的问题是：我是否需要在所有样本中规范化我的数据，或者最好先对我的数据进行子集化，然后对数据进行规范化。

谢谢。

关心Lisanne

答案 0 :(得分：0)

我认为这取决于你想要证明/展示的内容。如果你还想考虑你的“暗计数”，那么你应该首先将它标准化，这样你也会考虑实验失败的百分比。在这里，您的实验总数（好的和坏的结果）总计为一个。

如果你想找出你的“好事件”的分布，你应该首先制作你的好样本子集并在之后进行标准化。在这种情况下，您的好事件数量总计为1

所以再次，这取决于你想要证明什么。作为一名物理学家，我更喜欢第一种方法，因为我们不会删除不良数据点。

干杯TL