我有一个字符串,需要找到最常出现的字符串中的单词。我已经尝试过我可以想到的最大,最大,最大,排序,顺序和等级的每个变体 - 但似乎无法正确地解决语法问题。我也尝试过这里找到的所有方法:Calculate frequency of occurrence in an array using R
示例代码:
zzz <- c("jan", "feb", "jan", "mar", "mar", "jan", "feb") #random example data
zzz <- paste(zzz, collapse=" ") #make data look like what I'm working with
zzz
非常感谢任何建议!
答案 0 :(得分:2)
这个怎么样:
Freq <- table(unlist(strsplit(zzz," ")))
# > Freq
# feb jan mar
# 2 3 2
> Freq[which.max(Freq)]
jan
3
如果您只想将实际单词作为输出,
> names(Freq)[which.max(Freq)]
[1] "jan"
答案 1 :(得分:2)
您还可以factor
分割向量,然后tabulate
。
f <- factor(strsplit(zzz, " ")[[1]])
levels(f)[which.max(tabulate(f))]
# [1] "jan"