标签: scala apache-spark apache-spark-sql
我有一个MSSQL表作为数据源,我想以时间戳的形式保存某种处理偏移量(它是表的列之一)。因此有可能处理来自最新偏移量的数据。我想保存为Spark会话之间的某种共享状态。我研究了shared state in Spark session,但是,我找不到在共享状态下存储此偏移量的方法。那么可以使用现有的Spark构造来执行此任务吗?
答案 0 :(得分:1)
据我所知,尚无官方内置功能支持在Spark中会话之间传递数据。作为替代方案,我将考虑以下选项/建议:
让我知道是否需要进一步的信息