应用错误收集

cSplit（data，“ text”，“，”，“ long”）之后如何管理重复项？

时间：2019-05-15 01:56:02

标签： r duplicates

我正在验证一组数据，并希望设计可视化而不重复。例如，数据集

ID       Date      Hashtags
49312   28/3/2019   #apple
49312   28/3/2019   #orange
49312   28/3/2019   #grape
49313   02/4/2019   #orange
49314   02/4/2019   #apple

当我计算ID的总数时，它计算为5而不是3。如何管理这种类型的数据，以便对ID进行分组？

当我使用脚本时：-

newdata <- dataset [!duplicate(data$id)],

它删除了ID中的重复项，也删除了＃标签。

0 个答案:

没有答案