我想使用spark构建模型(特别是 - 决策树),然后使用纯python(而不是pyspark)应用程序来应用它们
似乎PMML导出是预期的方法,但树模型尚不支持它,我没有找到似乎处于活动开发状态的python的PMML库
答案 0 :(得分:2)
不再在开发中的是Augustus,https://code.google.com/p/augustus/。最近有一些工作要支持https://github.com/alex-pirozhenko/sklearn-pmml的scikitlearn pmml导入/导出,这可能是一种选择。
正如@ zero323所述,PMML导出仅适用于某些型号。对于其他模型,如果您的目标是特定的服务平台,您可以编写自己的自定义导出代码或编写自己的解析代码(对于Decission Tree' s是以自定义拼花格式编写的)。