应用错误收集

Spark结构化流式Kafka源检查点频率

时间：2019-01-14 01:56:59

标签： apache-spark apache-kafka spark-structured-streaming

我正在使用一个startingOffsets设置为earliest的Kafka主题。群集的保留期为48小时。显然，当查询第一次运行（没有检查点）时，它将从最早的偏移量开始。如果该应用程序在处理所有当前记录之前就被杀死了，它会从上次中断的位置重新开始，还是最早的偏移量开始？即在处理第一个批次（非常大且非常耗时）的过程中是否发生检查点？

0 个答案:

没有答案

结构化流卡夫卡源偏移存储
修复火花结构流媒体中的检查点
Spark结构化流媒体 - 限制？（源性能，不支持的操作，Spark UI）
使用S3数据源的Spark结构化流检查点
Spark结构化流式Kafka源检查点频率
清除检查点位置后，Spark结构化流消耗旧的Kafka偏移
了解Kakfa结构化流中的检查点
恢复后，kafka中的Spark结构化流式检查点是否在正确的偏移上重新启动
Spark结构化流式增量检查点
如何使用EMRFS通过结构化流进行检查点？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？