spark-ml naive bayes保存到hdfs

时间:2016-06-21 13:47:06

标签: hadoop apache-spark apache-spark-mllib apache-spark-ml

我知道通过spark-mllib我们可以通过save()方法将朴素贝叶斯模型保存到hdfs。但是我们尝试使用spark-ml朴素的贝叶斯来保存到hdfs然后它会给出错误。 错误的FS:hdfs:// localhost:8020 / pa / model / nb,期望:file:///

我正在使用spark-1.6.0和hadoop 2.7。

1 个答案:

答案 0 :(得分:1)

我在保存spark-ml模型方面也遇到了问题 - 这似乎并不是一种直截了当的方式。

尝试像这样保存 - 如果您收到路径错误,请尝试将其保存到tmp,如下所示。

sc.parallelize(Seq(NBmodel), 1).saveAsObjectFile(“/tmp/NBModel”)