是否可以在apache flink CEP中处理多个流?

时间:2017-07-28 17:15:16

标签: apache-flink flink-cep

我的问题是,如果我们有两个原始事件流,即冒烟温度,我们想知道复杂事件,即通过将运算符应用于原始流来实现,我们可以在Flink中执行此操作吗?

我问这个问题,因为我到目前为Flink CEP看到的所有例子都只包含一个输入流。如果我错了,请纠正我。

2 个答案:

答案 0 :(得分:3)

简短回答 - 是的,您可以根据不同流媒体资源中的事件类型阅读和处理多个流并触发规则。

长答案 - 我有一个类似的要求,我的回答是基于您正在阅读来自不同kafka主题的不同流的假设。

从不同主题中读取,在单个来源中汇总不同的事件:

FlinkKafkaConsumer010<BAMEvent> kafkaSource = new FlinkKafkaConsumer010<>(
        Arrays.asList("topicStream1", "topicStream2", "topicStream3"),
        new StringSerializerToEvent(),
        props);

kafkaSource.assignTimestampsAndWatermarks(new 
TimestampAndWatermarkGenerator());
DataStream<BAMEvent> events = env.addSource(kafkaSource)
        .filter(Objects::nonNull);

序列化程序读取数据并将其解析为具有通用格式 - 例如。

@Data
public class BAMEvent {
 private String keyid;  //If key based partitioning is needed
 private String eventName; // For different types of events
 private String eventId;  // Any other field you need
 private long timestamp; // For event time based processing 

 public String toString(){
   return eventName + " " + timestamp + " " + eventId + " " + correlationID;
 }

}

之后,事情非常简单,根据事件名称定义规则并比较事件名称以定义规则(您还可以按如下方式定义复杂规则):

Pattern.<BAMEvent>begin("first")
        .where(new SimpleCondition<BAMEvent>() {
          private static final long serialVersionUID = 1390448281048961616L;

          @Override
          public boolean filter(BAMEvent event) throws Exception {
            return event.getEventName().equals("event1");
          }
        })
        .followedBy("second")
        .where(new IterativeCondition<BAMEvent>() {
          private static final long serialVersionUID = -9216505110246259082L;

          @Override
          public boolean filter(BAMEvent secondEvent, Context<BAMEvent> ctx) throws Exception {

            if (!secondEvent.getEventName().equals("event2")) {
              return false;
            }

            for (BAMEvent firstEvent : ctx.getEventsForPattern("first")) {
              if (secondEvent.getEventId = firstEvent.getEventId()) {
                return true;
              }
            }
            return false;
          }
        })
        .within(withinTimeRule);

我希望这可以让您将一个或多个不同的流集成在一起。

答案 1 :(得分:0)

我想知道是否可以执行严格的链接(如果可以使用next,则可以使用followBy代替),因为在给定的流中,特定时间戳可能有很多事件。如此说来,对于时间t1-:a,b,c-这三个事件来了,对于时间t2-:a2,b2,c2来了flink引擎。所以,我想知道我们如何获得event(a).next(a2),因为从系列到-可能永远不是这样: 一种 b C a2 22 c2

但是,如果CEP模块处理事件以至于它将一个时间戳记视为单个事件,那么这很有意义。