如何基于`data.table'中的2列删除重复项

时间:2019-03-25 01:22:36

标签: r data.table

这是我的数据的样子:我有981756行和3列,看起来像这样

book_id user_id rating
 1         3      5
 1         3      4
 1         2      3
 1         5      3
 2         43     2
 2         23     4

并且我想删除基于book_id和user_id的重复项,因此一个用户对一本书仅应具有一个评分

并且我的输出应如下所示

book_id user_id rating
 1         3      5
 1         2      3
 1         5      3
 2         43     2
 2         23     4

这是我编写的不起作用的代码

r1 <- ratings[!duplicated(ratings[c(1,2)]),]

我收到这样的错误:

  

[.data.table(rd,!duplicated(rd [c(1,2)]),)中的错误:     我计算得出逻辑向量长度为​​2,但有200行。逻辑i的回收不再被允许,因为它隐藏了比值得提供的便利少的错误。如果您确实需要回收,请明确使用rep(...,length = .N)。

我不明白这是什么意思。有人可以帮我吗?

0 个答案:

没有答案