在pySpark中保存回归模型

时间:2015-03-22 03:55:56

标签: python pyspark apache-spark-mllib

在pySpark MLlib中,似乎无法保存和加载回归模型,例如LogisticRegressionModel,SVMModel,NaiveBayesModel和DecisionTreeModel。 加载并通过JavaSaveable和JavaLoader mixins保存在推荐器模型MatrixFactorizationModel上,但回归模型不是这样做的。

有没有办法通过提供自己的加载和保存例程来解决这个问题?如果是这样,我该怎么做呢?

这个功能是在未来版本中预期的,还是pySpark MLlib被逐步淘汰?

1 个答案:

答案 0 :(得分:0)

在Spark 1.3.1中,LinearModel类是大多数线性分类器(即LogisticRegressionModel)的基类,是一个纯Python类,所以你可以试着腌它或者您可以自己保存属性_coeff - weights()_intercept - intercept(),并构建通过权重和截距项的LogisticRegressionModel类,如下例所示:

model = LogisticRegressionModel(weights, intercept)