使用apache flink进行状态复杂事件处理

时间:2017-09-12 13:12:57

标签: java apache-flink flink-cep

我想基于具有相同标识符的两个事件来检测在定义的时间范围内是否发生了两个事件。例如,DoorEvent看起来像这样:

<doorevent>
  <door>
    <id>1</id>
    <status>open</status>
  </door>
  <timestamp>12345679</timestamp>
</doorevent> 

<doorevent>
  <door>
    <id>1</id>
    <status>close</status>
  </door>
  <timestamp>23456790</timestamp>
</doorevent>

以下示例中的DoorEvent java类具有相同的结构。

我想检测到id为1的门在打开后5分钟内关闭。我尝试使用Apache flink CEP库来实现此目的。传入流包含来自20门的所有打开和关闭消息。

Pattern<String, ?> pattern = Pattern.<String>begin("door_open").where(
    new SimpleCondition<String>() {
        private static final long serialVersionUID = 1L;
        public boolean filter(String doorevent) {
            DoorEvent event = new DoorEvent().parseInstance(doorevent, DataType.XML);
            if (event.getDoor().getStatus().equals("open")){
                // save state of door as open
                return true;
            }
            return false;                           
        }
    }
)
.followedByAny("door_close").where(
    new SimpleCondition<String>() {
            private static final long serialVersionUID = 1L;
            public boolean filter(String doorevent) throws JsonParseException, JsonMappingException, IOException {
                DoorEvent event = new DoorEvent().parseInstance(doorevent, DataType.XML);
                if (event.getDoor().getStatus().equals("close")){
                    // check if close is of previously opened door
                    return true;
                }
                return false;
            }
        }
)
.within(Time.minutes(5));

如何在door_open中将门1的状态保存为打开,以便在door_close步骤中我知道门1是关闭的门,而不是其他门?< / p>

1 个答案:

答案 0 :(得分:2)

如果你有Flink 1.3.0及以上版本,你真正想要做什么

你的模式看起来像这样:

Pattern.<DoorEvent>begin("first")
        .where(new SimpleCondition<DoorEvent>() {
          private static final long serialVersionUID = 1390448281048961616L;

          @Override
          public boolean filter(DoorEvent event) throws Exception {
            return event.getDoor().getStatus().equals("open");
          }
        })
        .followedBy("second")
        .where(new IterativeCondition<DoorEvent>() {
          private static final long serialVersionUID = -9216505110246259082L;

          @Override
          public boolean filter(DoorEvent secondEvent, Context<DoorEvent> ctx) throws Exception {

            if (!secondEvent.getDoor().getStatus().equals("close")) {
              return false;
            }

            for (DoorEvent firstEvent : ctx.getEventsForPattern("first")) {
              if (secondEvent.getDoor().getEventID().equals(firstEvent.getDoor().getEventId())) {
                return true;
              }
            }
            return false;
          }
        })
        .within(Time.minutes(5));

所以基本上你可以使用IterativeConditions并获得第一个模式的上下文,这些模式匹配并迭代该列表,同时比较你需要的那个并按你的意愿继续。

  

IterativeConditions很昂贵,应该相应地处理

有关条件的更多信息,请查看Flink - Conditions