标签: spark-structured-streaming spark-streaming-kafka
如果我的数据是上午10:00,我需要一个汇总的结果,直到当前日期的上午10.00 ...
有人可以帮助实现相同目标吗?
答案 0 :(得分:0)
我不确定我是否确切了解具体情况,但让我尝试回答。
我建议您进行两步操作:
/yyy-mm-dd/<offset from the day start>.parquet
2019-02-06/100000.parquet,2019-02-06/200000.parquet
2019-02-06/100000.parquet
2019-02-06/200000.parquet
您可以使用luigi之类的库进行管理。