标签: spring apache-kafka apache-kafka-streams
我需要处理大量文件,可能会有多个文件可能最终并行处理。
我想到的一个选项是推送到代理的每条消息都有:行数据+要应用的规则+一些关系ID(就像该特定文件的标识符)
我计划使用kafka流并使用处理器创建拓扑,该处理器将获取带有消息处理规则的规则并将其接收。
然而(我是kafka溪流的新手因此可能是错的):
答案 0 :(得分:1)
我想你可以设置一个密钥和值记录,可以发送到文件末尾的主题,这意味着文件的关闭。 假设记录有一个唯一的密钥,例如-1,表示eof