Question

我有一个字符串，需要找到最常出现的字符串中的单词。我已经尝试过我可以想到的最大，最大，最大，排序，顺序和等级的每个变体 - 但似乎无法正确地解决语法问题。我也尝试过这里找到的所有方法：Calculate frequency of occurrence in an array using R

示例代码：

zzz <- c("jan", "feb", "jan", "mar", "mar", "jan", "feb") #random example data
zzz <- paste(zzz, collapse=" ") #make data look like what I'm working with
zzz

非常感谢任何建议！

Answer 1

这个怎么样：

Freq <- table(unlist(strsplit(zzz," ")))
# > Freq
# feb jan mar 
# 2   3   2 
> Freq[which.max(Freq)]
jan 
  3

如果您只想将实际单词作为输出，

> names(Freq)[which.max(Freq)]
[1] "jan"

Answer 2

您还可以factor分割向量，然后tabulate。

f <- factor(strsplit(zzz, " ")[[1]])
levels(f)[which.max(tabulate(f))]
# [1] "jan"

R - 排序或查找字符串中单词的max（）

2 个答案: