我们可以将使用SparkR构建的随机森林模型导入R,然后使用getTree提取其中一棵树吗?

时间:2017-10-25 12:12:49

标签: r apache-spark random-forest sparkr

在决策树中,我们可以看到或可视化节点分裂,我想做类似的事情。但我使用的是SparkR,它没有决策树。所以我打算使用带有1棵树作为参数的随机森林并在SparkR上运行,然后保存模型并使用getTree查看节点拆分并使用ggplot进一步可视化。

1 个答案:

答案 0 :(得分:0)

简短的回答是

使用SparkR构建的模型与使用相应R软件包构建的模型不兼容,在本例中为randomForest;因此,您将无法使用后者的getTree函数来显示使用SparkR构建的随机林中的树。

在另一个层面上:我很惊讶决策树仍然没有进入SparkR - 它们似乎已经准备好了几个月以来在Github repo;但即使它们是,它们也不会提供可视化树木的方法,你仍然无法使用其他R包中的功能。