从数字向量列表

时间:2018-05-29 19:30:06

标签: r list dendrogram

我有一个data.frame(tibble),它是两列:一个id字符串和一个数字向量列表。

天真地,我可以通过行绑定do.call中的列然后运行距离来创建树形图。

# data (read in via MongoDB, i.e. mongolite); use runif for random samples
t <- tibble(id = c("123", "234", "345", "456"),
            l = list(runif(3), runif(3), runif(3), runif(3)))

# combine list into data.frame
z <- do.call(rbind.data.frame, t$l) 

# run dendrogram
dend <- as.dendrogram(hclust(dist(z)))

然而,这种方法非常严重。我的原始数据集是380k行,每条记录与512个元素(数字)的向量匹配。

什么是高效和整洁(例如,purrr和/或列表列)方法?

据我所知,将列列转换为data.frame / tibble的方法有很多种;但是,我希望通常能够避免使用data.frame / tibbles加速。

0 个答案:

没有答案