使用Caret和xgboost训练我的分类模型期间的警告消息

时间:2017-11-16 11:14:04

标签: r machine-learning r-caret xgboost

我在Caret中使用R来运行xgboost算法来解决机器学习分类问题。

运行以下R代码后,我收到警告消息(如下所示):

cl <- makeCluster(10, type = "SOCK")

registerDoSNOW(cl)

caret.cv <- train(market ~ ., 
                  data = mydata.train,
                  method = "xgbTree",
                  tuneGrid = tune.grid,
                  trControl = train.control)


Warning messages:
1: closing unused connection 12 (<-John-laptop.mycompany.local:11916) 
2: closing unused connection 11 (<-John-laptop.mycompany.local:11916) 
3: closing unused connection 10 (<-John-laptop.mycompany.local:11916) 
4: closing unused connection 9 (<-John-laptop.mycompany.local:11916) 
5: closing unused connection 8 (<-John-laptop.mycompany.local:11916) 
6: closing unused connection 7 (<-John-laptop.mycompany.local:11916) 
7: closing unused connection 6 (<-John-laptop.mycompany.local:11916) 
8: closing unused connection 5 (<-John-laptop.mycompany.local:11916) 
9: closing unused connection 4 (<-John-laptop.mycompany.local:11916) 
10: closing unused connection 3 (<-John-laptop.mycompany.local:11916)

我可以忽略它们并继续进行分析,或者在幕后出现问题吗?

1 个答案:

答案 0 :(得分:1)

评论太长了......

启动群集时,R与每个进程建立了连接。警告消息只是连接自动关闭。

停止群集并明确关闭群集会更优雅,但如果您没有遇到任何问题,您可以实际忽略它。

stopCluster(cl)这样的东西(取决于你加载了哪些库)会停止群集,但有时你仍会得到有关未使用连接的错误 - 这不太可能是一个真正的问题,因为你不接近连接限制。

请注意,笔记本电脑上的10个线程可能过多 - 尝试detectCores()包中的parallel,以获取处理器数量,并使用它。