R重复功能不处理不兼容的问题

时间:2015-04-19 12:43:09

标签: r duplicate-removal

我尝试使用duplicated在数据框中查找仅基于两列的重复行。

当我将任何内容传递给incomparables参数时,我收到错误

dups = duplicated(data, incomparables="Age")
...
argument 'incomparables != FALSE' is not used (yet)

我无法解决这个问题。

This question似乎遇到了类似的问题但没有回复。

毫无疑问,做同样的事情会有不同的方式,因为我是R的初学者,这也很有用。

1 个答案:

答案 0 :(得分:5)

首先,通过阅读?duplicated的文档,您将意识到incomparables参数接受一个不应该比较列值的值向量,我引用:

  

无法比较的值向量。

更详细

  

不可比较的值永远不会被标记为重复。这是   旨在用于一组相当小的值,而不是   非常有效的一套。

无论哪种方式,the source code都意味着即使您按照文档操作也无法使用它,因为此功能显示尚未实施

if(!identical(incomparables, FALSE))    
   .NotYetUsed("incomparables != FALSE")

但是,回到你的问题,为了对两列运行duplicated,你可以明确地命名它们,例如

duplicated(data[c("col1", "col2")]) ## (if the desired columns called col1 and col2)