如何处理不在列车数据中的测试数据中的其他列

时间:2017-07-31 14:57:15

标签: r machine-learning random-forest prediction

我一直在使用随机森林开发模型。我的列车数据集有15列,可以说A到O.使用上述功能训练模型。假设测试集也将具有相同数量的功能或列。但是现在客户端添加了少量列,并且模型无法预测新数据。它适用于回归和分类问题。

除了Train中可用的列之外,是否有任何方法/机制来处理或避免新添加的列?我们是否必须显式编写代码或者可以使用任何参数/内置函数来处理这种情况。感谢您的帮助。谢谢 !

1 个答案:

答案 0 :(得分:0)

只需保留列车数据中的列列表,并仅使用此列表中的列作为测试数据。