SparkException:由scala.collection.Iterator $$ anon $ 11引起的任务不可序列化

时间:2017-06-13 18:13:34

标签: apache-spark

我试图从分类文本文档的Spark示例中运行一个教程程序(JavaPipelineExample.java)。 JavaPipelineExample.java

但是当我试图使管道符合培训文件时,却在列表中给出了错误。

        Pipeline pipeline = new Pipeline()
                .setStages(new PipelineStage[]{tokenizer, hashingTF, lr});

        // Fit the pipeline to training documents.
        PipelineModel model = pipeline.fit(training);

错误是

org.apache.spark.SparkException: Task not serializable
Caused by: java.io.NotSerializableException: scala.collection.Iterator$$anon$11

我对这个错误感到很困惑,因为我的所有类都是可序列化的。有人可以帮忙吗? 谢谢!

0 个答案:

没有答案