我收到了一个包含Naive Bayes分类器模型的PMML文件。
是否可以将PMML文件导入MLlib并使用Python编程语言重建模型?
答案 0 :(得分:1)
是否可以将PMML文件导入MLlib ..
不可能,因为PMML和MLlib模型表示彼此不兼容。
如果您有PMML模型,那么您应该使用专用的PMML评分库(例如JPMML-Spark)在Apache Spark上执行它。
..并使用Python编程语言重建模型?
您的意思是使用PySpark访问PMML评分功能吗?您可以使用PySpark执行JPMML-Spark函数,不需要在Python中重建模型对象。
答案 1 :(得分:0)
您可以使用PyPMML-Spark在PySpark中导入PMML,例如:
from pypmml_spark import ScoreModel
model = ScoreModel.fromFile('the/pmml/model/path')
score_df = model.transform(df)