应用错误收集

您可以使用ssc方法

使用流式HDFS文件

val ssc = new StreamingContext（sparkConf，Seconds（batchTime））

val dStream = ssc.fileStream [LongWritable，Text，TextInputFormat]（ streamDirectory，（x：路径） =＆gt; true，newFilesOnly = false）

使用上面的api param filter用于过滤要处理的路径的函数。

如果您的条件不是文件路径/名称并且基于数据，则需要在条件满足时停止流式传输。

为此你需要使用线程实现， 1）在一个线程中，您需要继续检查流式上下文是否已停止，如果ssc已停止，则通知其他线程等待并创建新的流式上下文。

2）在第二个线程中，您需要检查条件，如果条件满足则停止流式传输。

如果您需要解释，请告诉我。