我在Caret
中使用R
来运行xgboost
算法来解决机器学习分类问题。
运行以下R
代码后,我收到警告消息(如下所示):
cl <- makeCluster(10, type = "SOCK")
registerDoSNOW(cl)
caret.cv <- train(market ~ .,
data = mydata.train,
method = "xgbTree",
tuneGrid = tune.grid,
trControl = train.control)
Warning messages:
1: closing unused connection 12 (<-John-laptop.mycompany.local:11916)
2: closing unused connection 11 (<-John-laptop.mycompany.local:11916)
3: closing unused connection 10 (<-John-laptop.mycompany.local:11916)
4: closing unused connection 9 (<-John-laptop.mycompany.local:11916)
5: closing unused connection 8 (<-John-laptop.mycompany.local:11916)
6: closing unused connection 7 (<-John-laptop.mycompany.local:11916)
7: closing unused connection 6 (<-John-laptop.mycompany.local:11916)
8: closing unused connection 5 (<-John-laptop.mycompany.local:11916)
9: closing unused connection 4 (<-John-laptop.mycompany.local:11916)
10: closing unused connection 3 (<-John-laptop.mycompany.local:11916)
我可以忽略它们并继续进行分析,或者在幕后出现问题吗?
答案 0 :(得分:1)
评论太长了......
启动群集时,R与每个进程建立了连接。警告消息只是连接自动关闭。
停止群集并明确关闭群集会更优雅,但如果您没有遇到任何问题,您可以实际忽略它。
像stopCluster(cl)
这样的东西(取决于你加载了哪些库)会停止群集,但有时你仍会得到有关未使用连接的错误 - 这不太可能是一个真正的问题,因为你不接近连接限制。
请注意,笔记本电脑上的10个线程可能过多 - 尝试detectCores()
包中的parallel
,以获取处理器数量,并使用它。