标签: r subset
我有一个大型数据框,如下所示
我希望每个ID保持相同的观察结果(在这种情况下只有3个) 我也希望在观察之间保持足够的间隔(即:保留第一个和最后一个,另一个在它们之间) 我如何对数据进行子集化并保留所需的
所以最终会像这样
答案 0 :(得分:2)
我们可以尝试data.table
data.table
library(data.table) setDT(df1)[, .SD[c(1,.N/2, .N)], by = ID]