R数据帧过滤和计数唯一条目

时间:2015-05-28 17:27:40

标签: r dataframe

假设我有一个数据框,例如:

A    B    C    D  
1    1    1    1  
1    1    1    1  
2    2    1    2  
2    2    2    2  
2    2    1    2  

我想创建一个只有唯一条目的数据框以及它发生次数的计数。所以像这样:

A    B    C    D    count
1    1    1    1     2  
2    2    1    2     2   
2    2    2    2     1  

我该怎么做?

2 个答案:

答案 0 :(得分:4)

您可以尝试使用“data.table”包,如下所示:

> library(data.table)
> as.data.table(dat)[, .N, by = names(dat)]
   A B C D N
1: 1 1 1 1 2
2: 2 2 1 2 2
3: 2 2 2 2 1

或与“dplyr”类似:

> library(dplyr)
> dat %>% group_by_(.dots = names(dat)) %>% summarise(n = n())
Source: local data frame [3 x 5]
Groups: A, B, C

  A B C D n
1 1 1 1 1 2
2 2 2 1 2 2
3 2 2 2 2 1

答案 1 :(得分:3)

base R选项

aggregate(cbind(Count=1:nrow(df1))~., df1, FUN=length)
#    A B C D Count
#  1 1 1 1 1     2
#  2 2 2 1 2     2
#  3 2 2 2 2     1

或@David Arenburg建议的修改

aggregate(Count ~ ., cbind(Count = 1, df1), FUN=length)