如何在Pyspark中加载Kmeans模型?加载时出现错误

时间:2018-09-17 08:37:30

标签: pyspark k-means distributed

我正在尝试加载先前使用pyspark.ml.clustering库保存的Kmeans模型。 我正在使用以下命令加载文件:

model = KMeansModel.load(sc,"KMeans_15thSept_4000")

但是,出现以下错误:

"File "/usr/lib/spark/python/lib/py4j-0.10.4-src.zip/py4j/protocol.py", line 319, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.mllib.clustering.KMeansModel.load.
: org.json4s.package$MappingException: Did not find value which can be converted into java.lang.String"

1 个答案:

答案 0 :(得分:0)

您已经使用pyspark.ml.clustering库保存了模型,并使用pyspark.mllib.clustering库加载了模型。根据此thread,这势必会引发错误。要加载模型,您必须执行以下操作-

from pyspark.ml.clustering import KMeansModel

model = KMeansModel.load(save_path_to_model)