我知道这是一个重复的问题,在这里被问到saving pipeline model in pyspark 1.6,但仍然没有明确的答案。任何人都可以建议吗?
joblib或cPickle不起作用,因为它给出了前一个链接中给出的相同错误。有没有办法在PySpark 1.6中保存管道,或者没有?我看到的关于模型持久性的问题主要与持久化ML模型有关。保存管道是一个完全不同的问题。有没有可用的黑客攻击?我需要Python(v2.7)实现。任何帮助表示赞赏。我使用pyspark.ml中的RandomForestClassifier作为分类算法,我的环境是Spark 1.6和Python 2.7(如果这有任何帮助)