DecisionTreeClassificationModel-如何在PySpark中解析和可视化决策树?

时间:2018-12-12 19:29:13

标签: python apache-spark pyspark decision-tree

我有一个由 DecisionTreeClassifier (类 DecisionTreeClassificationModel )拟合的模型,需要解析它的树节点以可视化子集或整个树,但是似乎方法PySpark API中可用的功能非常有限。 例如-我想取节点 N 并获取其父节点或所有叶子。 使用PySpark API有可能吗?到目前为止,我所能做的就是致电:

model.toDebugString()

并分析字符串以重新创建树结构。

我看到Java API提供了更多选项,但是我不知道如何在PySpark脚本中使用它。

我在网上也发现有一个spark-tree-plotting软件包甚至可以可视化该树,但是在尝试安装它时出现了一些故障(似乎不再维护它了。)

对于如何有效解析模型返回的决策树的任何提示,我将不胜感激。

0 个答案:

没有答案