我开发了Apache Flink连接器来从OrientDB源读取数据。它工作正常,从源读取数据并将它们放入数据集。但是,我想使用分页技术读取数据并逐页提取数据。知道我该怎么做吗?
答案 0 :(得分:0)
您正在使用查询? 使用此类查询可以获得有限数量的结果:
SELECT FROM <target> [WHERE ...] SKIP <records-to-skip> LIMIT <max-records>
答案 1 :(得分:0)
您可以将完整数据集拆分为跳过限制批次,并将其作为单独的flink作业运行,如CliFrontend suddenly shotdown during multiple batch jobs processing Flink在处理完第一页的所有记录之前不会读取第二页。
或者你应该通过flink-group实现分页逻辑,按页码的单页内所有记录,然后用并行处理所有页组1