我需要使用什么功能对R程序中列表中前四个最常用的单词进行排名?
例如,
c("apple", "banana", "apple", "banana", "banana",
"desk", "pen", "pen", "pen", "pen")
使它像
"pen"
"banana"
"apple"
"desk"
谢谢
答案 0 :(得分:9)
您可以按降序对表格值进行排序,然后使用名称来获取您要查找的输出。试试这个:
> x <- c("apple", "banana", "apple", "banana", "banana",
"desk", "pen", "pen", "pen", "pen")
> names(sort(table(x), decreasing = TRUE))
## [1] "pen" "banana" "apple" "desk"
答案 1 :(得分:4)
table
对于基础R来说很直观。这里是一个qdap方法:
library(qdap)
freq_terms(dat, 4)
## WORD FREQ
## 1 pen 4
## 2 banana 3
## 3 apple 2
## 4 desk 1
或者...
freq_terms(dat, 4)[, 1]
## [1] "pen" "banana" "apple" "desk"
答案 2 :(得分:0)
一种有效的方法是:
+