数据表中前10个频率的最大计数

时间:2015-01-15 05:45:07

标签: r count data.table

我想创建一个表格,列出人们停止课程的10个最常见的原因。我的停药调查有大约2,000个回复,其数据集名为“已停止使用”。有35个类别可以描述' Reason'。目前我一直使用下面的代码,但这给了我所有35个停用代码的频率。

Discontinued[,list(Count= .N), by = reason][order(-Count)]

1 个答案:

答案 0 :(得分:1)

data.table排序方式为setorder。而不是

Discontinued[,list(Count= .N), by = reason][order(-Count)][1:10]

使用它应该更快

setorder(Discontinued[, list(Count= .N), by = reason], -Count)[1L:10L]