我们正在尝试处理pyspark(版本2.3.2)从套接字接收的数据,该方法可以正常工作。然后将处理后的数据进一步发送到服务器。但是,当使用代码ssc.start(); ssc.awaitTermination()
提交驱动程序时,在终止被驱动程序捕获后,它不会将任何信息发送到服务器。可以看出执行被暂停了一会儿(可能是因为它正在集群上执行必要的操作以停止流上下文),但是此后它不会继续进行处理(也不提交给服务器)先前接收到的数据。我们在两行代码之后添加了ssc.stop(stopSparkContext = False)
,但仍然相同。文档没有提供更多信息,而pyspark源代码仅显示了调用的函数和方法。
我们非常感谢您的帮助。