初始矩阵如下所示:
1 A 1
1 B 1
1 C 1
2 A 1
3 A 1
3 C 1
有必要记住:
A B C
1 1 1 1
2 1 0 0
3 1 0 1
我使用的代码如下:
for (i in 1:length(t_data$cid)) {
t_cid <- t_data$cid[i]
t_val <- t_data$eventAction[i]
df_events[grep(t_cid, df_events$cid),grep(paste0("^",t_val,"$"), colnames(df_events))] <- 1
print(i)
}
但我们讨论的是第一个矩阵中的超过一百万行和第二个矩阵中的一百多列。 5 分钟内大约 10k 行,太慢了。请帮忙。
答案 0 :(得分:6)
我认为xtabs
会有所帮助
> as.data.frame.matrix(xtabs(V3 ~ ., df))
A B C
1 1 1 1
2 1 0 0
3 1 0 1
数据
> dput(df)
structure(list(V1 = c(1L, 1L, 1L, 2L, 3L, 3L), V2 = c("A", "B",
"C", "A", "A", "C"), V3 = c(1L, 1L, 1L, 1L, 1L, 1L)), class = "data.frame", row.names = c(NA,
-6L))