SparkR中的RandomForest算法?

时间:2016-08-30 11:52:47

标签: r sparkr

我在R中实现了randomForest算法,并尝试使用sparkR(来自Apache Spark 2.0.0)实现相同的算法。

但我发现只有线性模型函数,比如sparkR中的glm()实现 https://www.codementor.io/spark/tutorial/linear-models-apache-spark-1-5-uses-present-limitations

并且无法找到任何RandomForest(决策树算法)示例。 Spark的MLLib中有RandomForest,但也无法找到MLLib的R绑定。

请告诉我,SparkR(2.0.0)是否支持RandomForest?否则可以将SparkR与MLlib连接以使用RandomForest吗? 如果不是,我们如何使用SparkR实现这一目标?

1 个答案:

答案 0 :(得分:1)

是的,截至目前,它在SparkR中不可用。 可能的选择是在分布式数据块上构建随机林,并在以后组合您的树。 无论如何都是关于随机性的。

一个很好的链接:https://groups.google.com/forum/#!topic/sparkr-dev/3N6LK7k4NB0