假设我有一个数据框,例如:
A B C D
1 1 1 1
1 1 1 1
2 2 1 2
2 2 2 2
2 2 1 2
我想创建一个只有唯一条目的数据框以及它发生次数的计数。所以像这样:
A B C D count
1 1 1 1 2
2 2 1 2 2
2 2 2 2 1
我该怎么做?
答案 0 :(得分:4)
您可以尝试使用“data.table”包,如下所示:
> library(data.table)
> as.data.table(dat)[, .N, by = names(dat)]
A B C D N
1: 1 1 1 1 2
2: 2 2 1 2 2
3: 2 2 2 2 1
或与“dplyr”类似:
> library(dplyr)
> dat %>% group_by_(.dots = names(dat)) %>% summarise(n = n())
Source: local data frame [3 x 5]
Groups: A, B, C
A B C D n
1 1 1 1 1 2
2 2 2 1 2 2
3 2 2 2 2 1
答案 1 :(得分:3)
base R
选项
aggregate(cbind(Count=1:nrow(df1))~., df1, FUN=length)
# A B C D Count
# 1 1 1 1 1 2
# 2 2 2 1 2 2
# 3 2 2 2 2 1
或@David Arenburg建议的修改
aggregate(Count ~ ., cbind(Count = 1, df1), FUN=length)