我在这里有点沮丧......所以我有一个数据集,我需要扩展变量。我有超过44个变量,但意识到所有变量的操作数量可能消耗了太多内存(不太可能,因为我有8 Gb RAM,但我不知道)。
当我执行以下MWE代码时,我的R崩溃或中止,或导致核心转储。
library(dplyr)
matrix(runif(44*500), ncol = 44) %>%
as.data.frame() %>%
mutate_each(funs(as.numeric(scale(.))))
大约70%的时间会导致崩溃。它为什么会发生?为什么它不总是发生?
我尝试使用更少的变量(从44到22)并且仍然存在一些问题(MWE如下)。
matrix(runif(22*500), ncol = 22) %>%
as.data.frame() %>%
mutate_each(funs(as.numeric(scale(.))))
任何人都可以了解为什么会这样吗?我应该不以这种方式扩展变量吗?还有更好的方法吗?
答案 0 :(得分:1)
所以这个问题不会公开,对于那些即将看到问题的人来说。自问这个问题以来,dplyr
的更高版本已修复此问题。
运行上面的代码不再有任何问题。