R模型将索引字段视为必需因子

时间:2019-04-25 18:28:42

标签: r caret

我有一个经过训练的R模型(xgbtree方法,插入号),是从如下数据集中学习的。

文件编号,高级,ID1,ID2,ID3,ID4,ID5。

其中filenumber只是每一行的索引键,在训练练习中被省略,并且模型训练为“ Premium〜.-filenumber”

ID字段是每个包含1-10级的变量,我认为这与下面的特定问题无关。

在测试数据拆分中获得预测效果很好。现在,当我尝试使用完全相同的格式对整个新数据集进行预测时,它会抱怨filenumber字段具有新级别。它甚至不应该尝试使用文件号来获取预测。帮助?

错误: model.frame.default中的错误(术语,newdata,na.action = na.action,xlev = object $ xlevels):   因素文件编号具有新级别CE19CGL235320IC

0 个答案:

没有答案