计算R中字符类型列中元素的出现次数

时间:2017-08-01 09:03:29

标签: r optimization dataframe character find-occurrences

我有一个包含多个列的数据框。特别是,有一个字符类型的列,我想知道此列中是否至少出现过2次相同元素,如果是这样的话,我想知道元素和出现次数

例如,c("Test","Hi","Hello","Hi")应该给我("Hi", 2)

首先,我尝试count,但由于它不适用于角色,我试图找到一个str_count

的解决方案

我尝试了以下解决方案:

test <- c("Test","Hi","Hello","Hi")
res = c()
for (i in unique(test)){
  if (sum(str_count(test, i))>=2){
    res = cbind(res,c(i, sum(str_count(test, i))))
  }
}

res
     [,1]
[1,] "Hi"
[2,] "2" 

但实际上,我必须使用的数据非常大。由于这个解决方案远不是最佳的多循环,我对执行时间非常不满

您是否有任何建议来改进此代码或尝试不同的方法?

0 个答案:

没有答案