标签: apache-spark apache-spark-mllib decision-tree
有人可以向我解释一下Apache Spark中Gradient Boosted Trees和Random Forest上setThresholds()函数的用途是什么? Apache Spark官方网站上没有使用该功能的文档或示例,我很想知道是否可以将它用于我的特定目的。此函数是否为树所做的内部决策设置阈值?例如,对于数字列,使用setThresholds(5.0)相当于if(column < 5.0)?或者我错了吗?
setThresholds()
setThresholds(5.0)
if(column < 5.0)