我想将许多不同的过滤器应用于h2o数据帧,以创建独特的数据子集。我还想了解h2o使用的内存管理过程,因为我将把它应用于千兆字节的数据。
据我可以从类似的问题中看出,这个主题没有太多明确的答案,大多数问题已经有几年了。
library(h2o)
h2o.init()
h_mtcars <- as.h2o(mtcars)
### Subset of am == 1 and gear == 5 ###
index_am <- h_mtcars[["am"]] == 1
index_gear <- h_mtcars[["gear"]] == 5
index_combined <- index_am * index_gear
h_mtcars[index_combined, ]
有没有办法用字符串做这个,就像我们可以使用rlang和数据帧一样?
library(rlang)
expressions <- "am == '1' & gear == '5'"
index_local <- expressions %>% rlang::parse_quosure() %>% rlang::eval_tidy(mtcars)
mtcars[index_local, ]