这可能是一个很长的镜头,但任何人使用带有Mllib的RandomForest会遇到非常差的预测性能?这就是我正在做的事情:
所以理论上,我应该得到接近12289 1s的预测(特别是如果模型过度拟合)。但我得到的确是0 1,这对我来说听起来很荒谬,让我怀疑我的代码有问题或者我错过了什么。如果我玩这些设置,我会注意到类似的行为(虽然不是那么极端)。但我正在使用其他分类器获得正常行为,所以我认为这不是我的设置问题。
例如:
IMyInterface
这段代码都是背靠背运行的,所以我没有改变它们之间的任何东西。有没有人对此有可能的解释?