我想删除数据集中所有重复的行,这些重复行在数据集的第1,4,5列中具有相同的值。我做了以下事情:
cols <- c(col1,col4,col5)
NonJointTrip<-CLEANED[!duplicated(CLEANED[cols]) | duplicated(CLEANED[cols], fromLast = TRUE), ]
我的问题是此代码保留一行,而删除其他一行。我需要一个甚至不保持一行的代码。这是一个例子
col1 col2 col3 col4 col5
1 2 3 4 5
1 3 5 4 5
3 2 1 7 8
第一行和第二行在col1,col4,col5中具有相同的值,以上代码删除了其中一个并给了我
col1 col2 col3 col4 col5
1 2 3 4 5
3 2 1 7 8
但是我希望删除这两行并给我:
col1 col2 col3 col4 col5
3 2 1 7 8