我有一个包含23000行和8列的数据框
我想仅使用第1列中的唯一标识符对其进行子集化。我这样做,
total_res2 <- unique(total_res['Entrez.ID']);
这将生成17,000行,仅包含第1列的信息。
我想知道如何基于此列提取唯一行,并且仅使用这些唯一行来获取其他7列中的信息。
答案 0 :(得分:1)
这将返回包含每个total_res
值的第一个匹配项的Entrez.ID
行:
subset(total_res, ! duplicated( Entrez.ID ) )
或者您的意思是您只想要Entrez.ID
不重复的行:
subset(total_res, ave(seq_along(Entrez.ID), Entrez.ID, FUN = length) == 1 )
下次请提供测试数据和预期输出。