TL;博士
如何从多列上的multiplyr拆分中进行“分区”?
动机:
我对使用32个核心中的1个进行辛勤工作的总结感到不满意,所以我尝试使用multi-dplyer我在多个列上运行。
示例:
插图显示按单列分组,但是当我这样做时,我的其他分组列不予考虑。
代码:
library(dplyr)
library(multidplyr)
library(nycflights13)
flights1 <- partition(flights, flight)
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)
那么分年,月,日如何?
这对我不起作用:
flights1 <- partition(flights, list(year, month, day))
flights2 <- summarise(flights1, dep_delay = mean(dep_delay, na.rm = TRUE))
flights3 <- collect(flights2)
我似乎无法完成这项工作。你能指出一种正确或至少有效的方法吗?
答案 0 :(得分:1)
根据?partition
,partition
的用法是
partition(.data, ..., cluster = get_default_cluster())
其中...
是要分区的变量。不是传入变量列表,而是分别传递每个变量,即
partition(flights, year, month, day)