在MLlib中导入PMML文件

时间:2017-05-16 10:08:47

标签: python apache-spark-mllib pmml

我收到了一个包含Naive Bayes分类器模型的PMML文件。

是否可以将PMML文件导入MLlib并使用Python编程语言重建模型?

2 个答案:

答案 0 :(得分:1)

  

是否可以将PMML文件导入MLlib ..

不可能,因为PMML和MLlib模型表示彼此不兼容。

如果您有PMML模型,那么您应该使用专用的PMML评分库(例如JPMML-Spark)在Apache Spark上执行它。

  

..并使用Python编程语言重建模型?

您的意思是使用PySpark访问PMML评分功能吗?您可以使用PySpark执行JPMML-Spark函数,不需要在Python中重建模型对象。

答案 1 :(得分:0)

您可以使用PyPMML-Spark在PySpark中导入PMML,例如:

from pypmml_spark import ScoreModel

model = ScoreModel.fromFile('the/pmml/model/path')
score_df = model.transform(df)