消除数据集中的特定行

时间:2019-08-05 12:43:25

标签: r

我有一个.csv格式的数据框。该数据帧包括34500行。在此文件中,存在RNAseq分析结果的列表。这里的问题是一些基因有多个结果,我应该为每个基因选择一个条目,并且该条目应该具有最大的p值。我编辑了数据,仅获得了“基因符号”和“ p值”信息。

我如何删除/消除包含根据我的规则应消除的基因的行。我将添加一个截图,显示我的问题。

谢谢。

RNF144A, TTTY14, TAS2R8, KIAA0355, GCNT2 are examples of problem.

1 个答案:

答案 0 :(得分:1)

假定空格("")对应于前一个非空格“ Gene”的重复条目,请将空格更改为NAna_if),然后使用{{1 }}可以将NA更改为以前的非NA值(按“ Gene”分组),并获得带有fill值的“ pvalue”行

max