如何在纯python中运行spark mlib决策树模型?

时间:2015-09-14 21:21:43

标签: python apache-spark decision-tree pmml

我想使用spark构建模型(特别是 - 决策树),然后使用纯python(而不是pyspark)应用程序来应用它们

似乎PMML导出是预期的方法,但树模型尚不支持它,我没有找到似乎处于活动开发状态的python的PMML库

1 个答案:

答案 0 :(得分:2)

不再在开发中的是Augustus,https://code.google.com/p/augustus/。最近有一些工作要支持https://github.com/alex-pirozhenko/sklearn-pmml的scikitlearn pmml导入/导出,这可能是一种选择。

正如@ zero323所述,PMML导出仅适用于某些型号。对于其他模型,如果您的目标是特定的服务平台,您可以编写自己的自定义导出代码或编写自己的解析代码(对于Decission Tree' s是以自定义拼花格式编写的)。