我有一个由 DecisionTreeClassifier (类 DecisionTreeClassificationModel )拟合的模型,需要解析它的树节点以可视化子集或整个树,但是似乎方法PySpark API中可用的功能非常有限。 例如-我想取节点 N 并获取其父节点或所有叶子。 使用PySpark API有可能吗?到目前为止,我所能做的就是致电:
model.toDebugString()
并分析字符串以重新创建树结构。
我看到Java API提供了更多选项,但是我不知道如何在PySpark脚本中使用它。
我在网上也发现有一个spark-tree-plotting软件包甚至可以可视化该树,但是在尝试安装它时出现了一些故障(似乎不再维护它了。)
对于如何有效解析模型返回的决策树的任何提示,我将不胜感激。