应用错误收集

如何在writeSetream.start（）中使用.fit（）动作并避免org.apache.spark.sql.AnalysisException？

时间：2019-06-14 21:08:26

标签： spark-streaming apache-spark-mllib

我有以下代码：

dataset.writeStream().foreach(new ForeachWriter<Row>() {
           some function
        }).start().awaitTermination();

并且我使用idfModel fit来获取数据集：

        IDFModel idfModel = idf.fit(featurizedData);

然后，我收到以下错误：

org.apache.spark.sql.AnalysisException：具有流源的查询必须使用writeStream.start（）;;
执行

我注意到在idf.fit（）期间，它需要进入rdd级别以实现拟合。那么如何使用writeStream.start（）实现它？

我正在使用Spark 2.3 +。

0 个答案:

没有答案