我正在尝试使用雪在R中运行并行作业。我已经能够在旧版本的R和雪上毫无困难地运行非常相似的工作。 R包依赖性阻止我恢复。
会发生什么:我的作业在parRapply
步骤终止,即第一次节点必须执行不到报告Sys.info()
的任何操作。错误消息显示为:
Error in checkForRemoteErrors(val) :
3 nodes produced errors; first error: cannot open the connection
Calls: parRapply ... clusterApply -> staticClusterApply -> checkForRemoteErrors
规格: R 2.14.0,雪0.3-8,RedHat Enterprise Linux客户端版本5.6。雪包已经建立在R的正确版本上。
详细信息: 以下代码似乎执行正常:
cl <- makeCluster(3)
clusterEvalQ(cl,library(deSolve,lib="~/R/library"))
clusterCall(cl,function() Sys.info()[c("nodename","machine")])
我是最终用户,而不是系统管理员,但我非常渴望得到有关可能出错的建议和见解。
答案 0 :(得分:17)
出现这个神秘错误是因为在程序执行期间请求的输入文件实际上并不存在。每个节点都会尝试加载此文件然后失败,但这只会导致“无法打开连接”消息。
这意味着几乎任何事都可能导致“连接”错误。令人难以置信的烦人!