我有一个名为df
的数据框。我想检查每个文档,xcoordinate 和 ycoordinate是否相同。
doc <- c("doc1", "doc2", "doc3")
xcor <- c(3,4,5,3,4,5,3,4,4)
ycor <- c(2,6,8,2,6,8,2,6,8)
df <- data.frame(doc,xcor,ycor)
df
doc xcor ycor
doc1 3 2
doc2 4 6
doc3 5 8
doc1 3 2
doc2 4 6
doc3 5 8
doc1 3 2
doc2 4 6
doc3 4 8
我现在正在努力应对所有的应用功能,但这并不会产生预期的结果 这是
doc1 TRUE
doc2 TRUE
doc3 FALSE
答案 0 :(得分:4)
我认为您不需要apply
功能。我们可以在消除重复行后计算重复文档的数量:
table(df[!duplicated(df),]$doc) == 1
doc1 doc2 doc3
TRUE TRUE FALSE
甚至更短(@DavidArenburg):
table(unique(df)$doc) == 1
答案 1 :(得分:0)
嗯,您仍然可以使用lapply
:
unlist(lapply(lapply(lapply(split(df, doc), unique), nrow), `==`, 1))
看起来很乱,但它确实有效。