创建样本数据:
id <- c(12, 32, 42, 42, 52, 52, 67, 67)
relationship_id <- c(15,1,59,1,61,6,59,1)
sample.data <- data.frame(id,relationship_id)
对于出现多次的每个id,连接relationship_id:
combo <- aggregate(relationship_id ~ id, data = sample.data, paste, sep=",")
table(combo$relationship_id)
Error in table(combo$relationship_id) :
all arguments must have the same length
我弄清楚导致此错误的原因:
class(combo$relationship_id)
[1] "list"
但是当我尝试将列表向量强制转换为字符向量时:
combo["relationship_id"] <- lapply(combo["relationship_id"], as.character)
> head(combo)
id relationship_id
1 12 15
2 32 1
3 42 c("59", "1")
4 52 c("61", "6")
5 67 c("59", "1")
它包括连接语法...我理解我可以解析输出以使其可用,但为什么会发生这种情况?有没有更简单的方法来清理输出?
答案 0 :(得分:4)
你正试图解决错误的问题。如果您真的想将这些值折叠为单个字符向量,则应使用collapse = ","
而不是sep
。
combo <- aggregate(relationship_id ~ id, data = sample.data,
paste, collapse=",")
table(combo$relationship_id)
#
# 1 15 59,1 61,6
# 1 1 2 1