我之前问了一个类似但又不同的问题(here)
现在我想改变这个数据集:
dt <- data.table(a=c("A","A","A"),b=1:3,c=c(0,1,0))
dt
a b c
1: A 1 0
2: A 2 1
3: A 3 0
到这一个:
a 1 2 3
1: A 0 1 0
因此,列“b”的值应成为每列都带有“c”列的列。 “a”的值可以看作是参与者(这里只是一个人(“A”)。原始数据集继续使用B的多个值,依此类推。在“转置”之后,列“a”应该包含唯一值(例如A ,B,C等)
有什么建议吗?
答案 0 :(得分:5)
我想我可以看到你的目标。
以下内容应该应对b中不同的独特项目并排列它们。
.u = unique(dt$b) # find first the unique columns
ans = dt[,as.list(c[match(.u,b)]),by=a] # as.list is the way to make columns
setnames(ans,c("a",.u)) # rename once afterwards is faster
ans
a 1 2 3
1: A 0 1 0
在更复杂的案件中未经测试。