标签: scala apache-spark apache-spark-mllib apache-spark-ml
我想比较Spark中线性回归(以及可能的广义线性回归)的不同实现。我想知道为什么不建议使用具有随机梯度下降的线性回归(和GLM)函数?
我发现一些老帖子涉及LinearRegressionSGD问题,并说它比L-BFGS慢,但我不确定它们的含义。 SGD是否应该更好(例如参见this discussion on Quora)?是否有计划在基于DataFrame的新API中再次提供这些功能?