Question

我有一个包含23000行和8列的数据框

我想仅使用第1列中的唯一标识符对其进行子集化。我这样做，

total_res2 <- unique(total_res['Entrez.ID']);

这将生成17,000行，仅包含第1列的信息。

我想知道如何基于此列提取唯一行，并且仅使用这些唯一行来获取其他7列中的信息。

Answer 1

这将返回包含每个total_res值的第一个匹配项的Entrez.ID行：

subset(total_res, ! duplicated( Entrez.ID ) )

或者您的意思是您只想要Entrez.ID不重复的行：

subset(total_res, ave(seq_along(Entrez.ID), Entrez.ID, FUN = length) == 1 )

下次请提供测试数据和预期输出。