我有一个如下所示的数据框:
dput(test.df)
structure(c("a", "a", "b", "c", "d", "1", "2", "3", "3", "4"), .Dim = c(5L,
2L), .Dimnames = list(NULL, c("session_", "vid_")))
我在R中需要做的是检查哪些会话有多于1个vid_,然后在新列中将其标记为TRUE,因此结果如下所示:
> dput(results.df)
structure(c("a", "a", "b", "c", "d", "1", "2", "3", "3", "4",
"TRUE", "TRUE", "FALSE", "FALSE", "FALSE"), .Dim = c(5L, 3L), .Dimnames = list(
NULL, c("session_", "vid_", "dirty_session")))
我希望在一行代码中以干净的方式进行,而不是分组并将vid计入单独的数据集并将其连接回原始集合 任何帮助赞赏