Apache Spark ALS - 如何解决最小二乘问题?

时间:2015-02-24 18:47:34

标签: scala apache-spark machine-learning

可以找到Apache Spark ALS的源代码here

我想知道这个源代码中最小二乘解决方法的进展情况?我找不到它的生命。 在Collaborative Filtering上执行教程/演练时,它会显示要对某些评级执行ALS功能,请调用ALS.train(ratings, rank, numIterations, lambda)。检查源代码和train函数会调用run函数,该函数返回一个MatrixFactorizationModel,其中包含预测的评分。

此外,ALS (found here)的API表示有一种名为solveLeastSquares的方法,但它不在first link中找到的源代码中。我想了解最小二乘问题是如何解决的,以便我可以根据需要进行调整。

1 个答案:

答案 0 :(得分:1)

来自documentation

  

(重大改变)在ALS中,删除了无关的方法solveLeastSquares。 DeveloperApi方法analyzeBlocks也被删除了。

但是,您可以更改引用的分支to be 1.1 per the docs,您会看到solveLeastSquares方法