如何计算列表中唯一向量的数量?

时间:2016-03-16 21:58:08

标签: r

说我有一个向量列表。我想要列出该列表中的唯一向量及其频率。我可以使用unique获取唯一值的列表,但我无法弄清楚如何获取计数的向量。

my.list <- list(c(1, 1, 0), c(1, 1, 0))
> unique(my.list)  # gives correct answer
# [[1]]
# [1] 1 1 0

现在我想要一些东西,它给出了unique(my.list)的每个元素重复次数的向量。在这种情况下,它应该是具有元素2的矢量。

使用table不起作用,因为它分别取向量的每个元素(0和1值):

> table(my.list)
#          my.list.2
# my.list.1 0 1
#         0 1 0
#         1 0 2

有什么想法吗?我宁愿不将paste这些变成一个字符串,然后如果我可以帮助它们,则将它们重新分成矢量。

2 个答案:

答案 0 :(得分:7)

在整个列表中使用match与唯一列表:

my.list <- list(c(1, 1, 0), c(1, 1, 0), c(2, 1, 0))
table(match(my.list,unique(my.list)))

#1 2 
#2 1

cbind(
  data.frame(id=I(unique(my.list))),  
  count=as.vector(table(match(my.list,unique(my.list)))) 
)
#       id count
#1 1, 1, 0     2
#2 2, 1, 0     1

答案 1 :(得分:4)

一种方法,可能比它需要的更复杂:

library(dplyr)
df <- do.call(rbind, my.list) %>% as.data.frame()
df %>% group_by_(.dots = names(df)) %>% summarise(count = n())

# Source: local data frame [1 x 4]
# Groups: V1, V2 [?]
# 
#      V1    V2    V3 count
#   (dbl) (dbl) (dbl) (int)
# 1     1     1     0     2

编辑:

根据以下@docendodiscimus的评论,group_bysummarise(n())相当于count_

df %>% count_(names(df))    # or just count_(df, names(df))

# Source: local data frame [1 x 4]
# Groups: V1, V2 [?]
# 
#      V1    V2    V3     n
#   (dbl) (dbl) (dbl) (int)
# 1     1     1     0     2