我正在尝试加载先前使用pyspark.ml.clustering
库保存的Kmeans模型。
我正在使用以下命令加载文件:
model = KMeansModel.load(sc,"KMeans_15thSept_4000")
但是,出现以下错误:
"File "/usr/lib/spark/python/lib/py4j-0.10.4-src.zip/py4j/protocol.py", line 319, in get_return_value
py4j.protocol.Py4JJavaError: An error occurred while calling z:org.apache.spark.mllib.clustering.KMeansModel.load.
: org.json4s.package$MappingException: Did not find value which can be converted into java.lang.String"
答案 0 :(得分:0)
您已经使用pyspark.ml.clustering库保存了模型,并使用pyspark.mllib.clustering库加载了模型。根据此thread,这势必会引发错误。要加载模型,您必须执行以下操作-
from pyspark.ml.clustering import KMeansModel
model = KMeansModel.load(save_path_to_model)