这就是我的代码的样子:
set <- c("Title", "Another one", "They can have a lot of characters") #and so on
name.set <- c("First","Second","Third")
names(set) <- name.set
这只是一个例子,真实数据集有大约800行和10个变量。需要注意的是,“set”中的值可以包含多个单词。
我希望有一个代码来检查数据集中的每个单词(逐字逐句),并将最常见的单词返回给我。