说我有一个向量列表。我想要列出该列表中的唯一向量及其频率。我可以使用unique
获取唯一值的列表,但我无法弄清楚如何获取计数的向量。
my.list <- list(c(1, 1, 0), c(1, 1, 0))
> unique(my.list) # gives correct answer
# [[1]]
# [1] 1 1 0
现在我想要一些东西,它给出了unique(my.list)
的每个元素重复次数的向量。在这种情况下,它应该是具有元素2
的矢量。
使用table
不起作用,因为它分别取向量的每个元素(0和1值):
> table(my.list)
# my.list.2
# my.list.1 0 1
# 0 1 0
# 1 0 2
有什么想法吗?我宁愿不将paste
这些变成一个字符串,然后如果我可以帮助它们,则将它们重新分成矢量。
答案 0 :(得分:7)
在整个列表中使用match
与唯一列表:
my.list <- list(c(1, 1, 0), c(1, 1, 0), c(2, 1, 0))
table(match(my.list,unique(my.list)))
#1 2
#2 1
cbind(
data.frame(id=I(unique(my.list))),
count=as.vector(table(match(my.list,unique(my.list))))
)
# id count
#1 1, 1, 0 2
#2 2, 1, 0 1
答案 1 :(得分:4)
一种方法,可能比它需要的更复杂:
library(dplyr)
df <- do.call(rbind, my.list) %>% as.data.frame()
df %>% group_by_(.dots = names(df)) %>% summarise(count = n())
# Source: local data frame [1 x 4]
# Groups: V1, V2 [?]
#
# V1 V2 V3 count
# (dbl) (dbl) (dbl) (int)
# 1 1 1 0 2
根据以下@docendodiscimus的评论,group_by
和summarise(n())
相当于count_
:
df %>% count_(names(df)) # or just count_(df, names(df))
# Source: local data frame [1 x 4]
# Groups: V1, V2 [?]
#
# V1 V2 V3 n
# (dbl) (dbl) (dbl) (int)
# 1 1 1 0 2