Spark ML decisiontree分类器调用随机森林方法

时间:2017-07-18 12:22:27

标签: scala apache-spark machine-learning apache-spark-mllib

我正在使用ML库中的分类器运行以下代码:

val decisionTree = new DecisionTreeClassifier().setLabelCol("label").setFeaturesCol("features").setMaxDepth(7).setImpurity("gini")
val model = decisionTree.fit(df3)
val prediction = model.transform(df3)

当我看着星火历史时,这就是我所看到的: enter image description here

为什么我的单一决策树使用randomForest方法,我做错了什么?还有为什么有些任务与其他任务相比真的很长? (如果我能做些什么来加快速度,我想知道)

ML文档没有提供有关此内容的更多信息......

1 个答案:

答案 0 :(得分:2)

  

随机森林是决策树的集合

所以这与决策树相同。 如果你将最大值从7调整到1,那么它会花费更少的时间,但你会得不到装备。它也是基于公羊的大小。