Question

我正在使用ML库中的分类器运行以下代码：

val decisionTree = new DecisionTreeClassifier().setLabelCol("label").setFeaturesCol("features").setMaxDepth(7).setImpurity("gini")
val model = decisionTree.fit(df3)
val prediction = model.transform(df3)

当我看着星火历史时，这就是我所看到的：

为什么我的单一决策树使用randomForest方法，我做错了什么？还有为什么有些任务与其他任务相比真的很长？（如果我能做些什么来加快速度，我想知道）

ML文档没有提供有关此内容的更多信息......

Answer 1

随机森林是决策树的集合

所以这与决策树相同。如果你将最大值从7调整到1，那么它会花费更少的时间，但你会得不到装备。它也是基于公羊的大小。

Spark ML decisiontree分类器调用随机森林方法

1 个答案: