我正在验证一组数据,并希望设计可视化而不重复。例如,数据集
ID Date Hashtags
49312 28/3/2019 #apple
49312 28/3/2019 #orange
49312 28/3/2019 #grape
49313 02/4/2019 #orange
49314 02/4/2019 #apple
当我计算ID的总数时,它计算为5而不是3。如何管理这种类型的数据,以便对ID进行分组?
当我使用脚本时:-
newdata <- dataset [!duplicate(data$id)],
它删除了ID
中的重复项,也删除了#标签。