按频率排序唯一值

时间:2014-04-23 02:40:20

标签: r ranking

我需要使用什么功能对R程序中列表中前四个最常用的单词进行排名?

例如,

c("apple", "banana", "apple", "banana", "banana", 
  "desk", "pen", "pen", "pen", "pen")

使它像

"pen"
"banana"
"apple"
"desk"

谢谢

3 个答案:

答案 0 :(得分:9)

您可以按降序对表格值进行排序,然后使用名称来获取您要查找的输出。试试这个:

> x <- c("apple", "banana", "apple", "banana", "banana", 
         "desk", "pen", "pen", "pen", "pen")
> names(sort(table(x), decreasing = TRUE))
## [1] "pen"    "banana" "apple"  "desk"  

答案 1 :(得分:4)

table对于基础R来说很直观。这里是一个qdap方法:

library(qdap)
freq_terms(dat, 4)

##   WORD   FREQ
## 1 pen       4
## 2 banana    3
## 3 apple     2
## 4 desk      1

或者...

freq_terms(dat, 4)[, 1]
## [1] "pen"    "banana" "apple"  "desk"

答案 2 :(得分:0)

一种有效的方法是:

+