我有一个包含多个列的数据框。特别是,有一个字符类型的列,我想知道此列中是否至少出现过2次相同元素,如果是这样的话,我想知道元素和出现次数
例如,c("Test","Hi","Hello","Hi")
应该给我("Hi", 2)
首先,我尝试count
,但由于它不适用于角色,我试图找到一个str_count
我尝试了以下解决方案:
test <- c("Test","Hi","Hello","Hi")
res = c()
for (i in unique(test)){
if (sum(str_count(test, i))>=2){
res = cbind(res,c(i, sum(str_count(test, i))))
}
}
res
[,1]
[1,] "Hi"
[2,] "2"
但实际上,我必须使用的数据非常大。由于这个解决方案远不是最佳的多循环,我对执行时间非常不满
您是否有任何建议来改进此代码或尝试不同的方法?