将一列列表强制转换为R数据帧中的字符串

时间:2015-01-06 16:02:25

标签: r

创建样本数据:

id <- c(12, 32, 42, 42, 52, 52, 67, 67)
relationship_id <- c(15,1,59,1,61,6,59,1)
sample.data <- data.frame(id,relationship_id)

对于出现多次的每个id,连接relationship_id:

combo <- aggregate(relationship_id ~ id, data = sample.data, paste, sep=",")
table(combo$relationship_id)
Error in table(combo$relationship_id) :
  all arguments must have the same length

我弄清楚导致此错误的原因:

class(combo$relationship_id)
[1] "list"

但是当我尝试将列表向量强制转换为字符向量时:

combo["relationship_id"] <- lapply(combo["relationship_id"], as.character)
> head(combo)    
  id relationship_id
1 12              15
2 32               1
3 42    c("59", "1")
4 52    c("61", "6")
5 67    c("59", "1")

它包括连接语法...我理解我可以解析输出以使其可用,但为什么会发生这种情况?有没有更简单的方法来清理输出?

1 个答案:

答案 0 :(得分:4)

你正试图解决错误的问题。如果您真的想将这些值折叠为单个字符向量,则应使用collapse = ","而不是sep

combo <- aggregate(relationship_id ~ id, data = sample.data, 
                   paste, collapse=",")
table(combo$relationship_id)
# 
#    1   15 59,1 61,6 
#    1    1    2    1