xdf文件上的rxDForest

时间:2018-10-09 02:53:46

标签: r revoscaler

我有一个“培训”和“测试” .xdf文件。我正在尝试使用rxDForest函数为回归树建模,但是当我包含一个具有49个级别的分类变量country_id时,作为预测变量,该函数只是没有完成,我需要结束会话。在没有分类变量的情况下,效果也很好。

以下是命令:

# load necessary package ---
library(RevoScaleR)
water.Dforest_2014 <- rxDForest(status.f ~  Report.Month + fecal_coliform_value  +  Yrs_Exist + country_id.f
                       , data = 'water_point.splitVar.Train.xdf' 
                       , maxUnorderedLevels = 50 
                       , maxDepth = 10, mTry = 2 , nTree = 2)
  

行读取:107443,已处理的行总数:107443,总块时间:0.043秒

     

行读取:107443,已处理的行总数:107443,总块时间:0.049秒

以上两条消息后,该函数未完成执行。 此处:

  • status.f是一个因子变量,值为“是”或“否”
  • country_id.f是一个具有49个水平的因子变量;和
  • 其余变量都是数字。

.xdf文件存在此问题。在dataframe上使用相同的命令效果很好。

可以提出建议吗?谢谢

0 个答案:

没有答案