在pySpark MLlib中,似乎无法保存和加载回归模型,例如LogisticRegressionModel,SVMModel,NaiveBayesModel和DecisionTreeModel。 加载并通过JavaSaveable和JavaLoader mixins保存在推荐器模型MatrixFactorizationModel上,但回归模型不是这样做的。
有没有办法通过提供自己的加载和保存例程来解决这个问题?如果是这样,我该怎么做呢?
这个功能是在未来版本中预期的,还是pySpark MLlib被逐步淘汰?
答案 0 :(得分:0)
在Spark 1.3.1中,LinearModel
类是大多数线性分类器(即LogisticRegressionModel
)的基类,是一个纯Python类,所以你可以试着腌它或者您可以自己保存属性_coeff - weights()
和_intercept - intercept()
,并构建通过权重和截距项的LogisticRegressionModel
类,如下例所示:
model = LogisticRegressionModel(weights, intercept)