我试图从分类文本文档的Spark示例中运行一个教程程序(JavaPipelineExample.java)。 JavaPipelineExample.java
但是当我试图使管道符合培训文件时,却在列表中给出了错误。
Pipeline pipeline = new Pipeline()
.setStages(new PipelineStage[]{tokenizer, hashingTF, lr});
// Fit the pipeline to training documents.
PipelineModel model = pipeline.fit(training);
错误是
org.apache.spark.SparkException: Task not serializable
Caused by: java.io.NotSerializableException: scala.collection.Iterator$$anon$11
我对这个错误感到很困惑,因为我的所有类都是可序列化的。有人可以帮忙吗? 谢谢!