我想创建一个表格,列出人们停止课程的10个最常见的原因。我的停药调查有大约2,000个回复,其数据集名为“已停止使用”。有35个类别可以描述' Reason'。目前我一直使用下面的代码,但这给了我所有35个停用代码的频率。
Discontinued[,list(Count= .N), by = reason][order(-Count)]
答案 0 :(得分:1)
data.table
排序方式为setorder
。而不是
Discontinued[,list(Count= .N), by = reason][order(-Count)][1:10]
使用它应该更快
setorder(Discontinued[, list(Count= .N), by = reason], -Count)[1L:10L]