子集化数据帧

时间:2014-04-05 12:59:50

标签: r

我有一个包含23000行和8列的数据框

我想仅使用第1列中的唯一标识符对其进行子集化。我这样做,

total_res2 <- unique(total_res['Entrez.ID']);

这将生成17,000行,仅包含第1列的信息。

我想知道如何基于此列提取唯一行,并且仅使用这些唯一行来获取其他7列中的信息。

1 个答案:

答案 0 :(得分:1)

这将返回包含每个total_res值的第一个匹配项的Entrez.ID行:

subset(total_res, ! duplicated( Entrez.ID ) )

或者您的意思是您只想要Entrez.ID不重复的行:

subset(total_res, ave(seq_along(Entrez.ID), Entrez.ID, FUN = length) == 1 )

下次请提供测试数据和预期输出。