标签: scala spark-structured-streaming stateful
我们目前正在进行状态处理,我们需要在存储中存储3年以上的数据。
然后,我读取了此属性spark.sql.streaming.minBatchesToRetain,默认值为100。
spark.sql.streaming.minBatchesToRetain
这还会影响存储在检查点中的状态数据吗?还是仅适用于偏移,提交,源等元数据?