标签: apache-spark pyspark linear-regression apache-spark-mllib apache-spark-ml
在PySpark中训练回归模型期间是否可以指定某些系数应保持不变(以预定值)?
例如,如果我有如下所示的简单单特征数据,我可以使用线性回归拟合直线,并允许两个系数拟合。然后我得到了绿线。
但是,如果我知道斜率是2.3,我可以将该系数修正为2.3并拟合截距,即蓝线。
这是一个简单的例子,但有没有办法在Spark(特别是PySpark)中做到这一点?
或者是否有添加自定义成本函数的钩子? (如果某些系数远离预期值,我可以使成本非常大。)