我有一个data.frame(tibble),它是两列:一个id字符串和一个数字向量列表。
天真地,我可以通过行绑定do.call中的列然后运行距离来创建树形图。
# data (read in via MongoDB, i.e. mongolite); use runif for random samples
t <- tibble(id = c("123", "234", "345", "456"),
l = list(runif(3), runif(3), runif(3), runif(3)))
# combine list into data.frame
z <- do.call(rbind.data.frame, t$l)
# run dendrogram
dend <- as.dendrogram(hclust(dist(z)))
然而,这种方法非常严重。我的原始数据集是380k行,每条记录与512个元素(数字)的向量匹配。
什么是高效和整洁(例如,purrr和/或列表列)方法?
据我所知,将列列转换为data.frame / tibble的方法有很多种;但是,我希望通常能够避免使用data.frame / tibbles加速。