我正在尝试在具有多个节点的计算中心中运行条件逻辑回归,以评估969万行的大数据集。但计算取消,因为作业超过了容量最高的节点的最大内存量90GB。
我听说R包“Rmpi”可以在多个节点上运行计算。
我正在使用以下代码来运行条件logit回归:
library(survival)
All <- read.table("/scratch/rvonscha/all.txt", header=TRUE, sep=";", na.strings="NA", dec=",", strip.white=TRUE)
attach(All)
model <- clogit(Alliance ~ OVB + BVB + CVC + EarlyStage + AvgVCSize +NumberVC + strata(Strata))
summary(model)
是否可以使用Rmpi进行此计算?如果可以,我该如何在代码中实现它?
我真的很感激有任何帮助来解决这个问题。
非常感谢你。