我有一个“培训”和“测试” .xdf文件。我正在尝试使用rxDForest函数为回归树建模,但是当我包含一个具有49个级别的分类变量country_id
时,作为预测变量,该函数只是没有完成,我需要结束会话。在没有分类变量的情况下,效果也很好。
以下是命令:
# load necessary package ---
library(RevoScaleR)
water.Dforest_2014 <- rxDForest(status.f ~ Report.Month + fecal_coliform_value + Yrs_Exist + country_id.f
, data = 'water_point.splitVar.Train.xdf'
, maxUnorderedLevels = 50
, maxDepth = 10, mTry = 2 , nTree = 2)
行读取:107443,已处理的行总数:107443,总块时间:0.043秒
行读取:107443,已处理的行总数:107443,总块时间:0.049秒
以上两条消息后,该函数未完成执行。 此处:
status.f
是一个因子变量,值为“是”或“否” country_id.f
是一个具有49个水平的因子变量;和 .xdf文件存在此问题。在dataframe
上使用相同的命令效果很好。
可以提出建议吗?谢谢