应用错误收集

ML（Spark 1.6.2）中Logistic回归的优化例程

时间：2016-07-28 15:59:45

标签： apache-spark machine-learning apache-spark-ml

亲爱的Apache Spark Comunity：

几个星期以来，我一直在阅读Spark的文档。我读了MLlib中的Logistic回归，我意识到Spark使用两种优化例程（SGD和L-BFGS）。

但是，目前我正在阅读ML中的LogistReg文档。我无法明确看到什么样的优化例程devlopers使用。我该如何申请这些信息？

非常感谢， Kevin Isaac Carbajal

1 个答案:

答案 0 :(得分：-1)

关键在于他们正在使用的API。

MlLib专注于RDD API。 Spark的核心，但Sums，Avgs和其他类型的简单函数等过程在DataFrame过程中花费的时间更多。

ML是一个使用数据帧的库。该dataFrame具有基本函数的查询优化，如sums和某种类型的近似。

您可以查看此博客SonarQube Generic Test Coverage，这是ML应该比MlLib更快的原因之一。