我正在使用Spark 2.2的结构化流媒体并运行几个长期流媒体作业。每隔一天或两天,我会遇到以下错误:
用户类抛出异常:org.apache.spark.sql.streaming.StreamingQueryException:无法获取块:BP-xxx:blk_xxx file = / xxx / offsets / xxx
当我遇到此错误时,作业仍然无法重新启动。我必须手动删除检查点文件。
我发现checkpointLocation下的偏移/提交文件是复制因子1.我想将复制因子更改为3将 解决这个问题。
如何将检查点偏移/提交的复制因子设置为3?