标签: machine-learning scikit-learn
对于培训我使用大约500k记录和大约15个独特的功能。当我将它适用于RandomForestRegressor或GradientBoostingRegressor时,它几乎不需要任何时间来适应,并返回所有功能重要性的全零。然后对于测试数据,它对整个集合进行相同的非常低的预测,这是非常可变的。得分为负,接近0。
从抽象意义上讲,为什么会发生这种情况?这是否意味着列车数据有问题?