标签: r machine-learning random-forest
我有一套324个房屋售价的测试装置。我的随机森林回归模型可以预测其中的300多个,但误差很小,除了一项极端异常的观察结果。观测值的预测值对该模型具有误导性,从而大大高估了价格。
人们如何调整随机森林模型以针对具有误导性预测变量的观察进行调整? (即,房屋“质量”变量为10,但与其他房屋相比,实际售价较低)。
我正在使用r中的randomForest()包作为模型。