我有一个.csv格式的数据框。该数据帧包括34500行。在此文件中,存在RNAseq分析结果的列表。这里的问题是一些基因有多个结果,我应该为每个基因选择一个条目,并且该条目应该具有最大的p值。我编辑了数据,仅获得了“基因符号”和“ p值”信息。
我如何删除/消除包含根据我的规则应消除的基因的行。我将添加一个截图,显示我的问题。
谢谢。
答案 0 :(得分:1)
假定空格(""
)对应于前一个非空格“ Gene”的重复条目,请将空格更改为NA
(na_if
),然后使用{{1 }}可以将NA更改为以前的非NA值(按“ Gene”分组),并获得带有fill
值的“ pvalue”行
max