在PySpark的回归训练中,某些系数能保持不变吗?

时间:2016-07-25 22:33:48

标签: apache-spark pyspark linear-regression apache-spark-mllib apache-spark-ml

在PySpark中训练回归模型期间是否可以指定某些系数应保持不变(以预定值)?

例如,如果我有如下所示的简单单特征数据,我可以使用线性回归拟合直线,并允许两个系数拟合。然后我得到了绿线。

但是,如果我知道斜率是2.3,我可以将该系数修正为2.3并拟合截距,即蓝线。

这是一个简单的例子,但有没有办法在Spark(特别是PySpark)中做到这一点?

或者是否有添加自定义成本函数的钩子? (如果某些系数远离预期值,我可以使成本非常大。)

example of two fits, one with a fixed slope

0 个答案:

没有答案