假设生产者生成10条消息,它将存储在broker中。如果我想访问特别是6和7消息,我可以从消费者客户端获取。 请告诉我任何一个我必须采用哪种方式来处理这种情况。
答案 0 :(得分:0)
我想你必须阅读完整的流并使用过滤器来获得你感兴趣的内容。例如,使用spark从kafka获取偶数编号的数据。
JavaRDD<String> filter = input.filter(new Function<String, Boolean>() {
int i = 0;
@Override
public Boolean call(String v1) throws Exception {
return i++ % 2 == 0;
}
});