在猪的记录计算后记录

时间:2013-12-12 16:41:24

标签: hadoop apache-pig

我想执行以下任务: 假设我已按照下面的给定示例订购了记录序列

时间戳事件

10:00 A

10:01 B

10:05 A

10:09 A

10:10 B

“良好”事件序列是A-> B.如果有一个A没有跟随B,那么在有另一个A之前,它被认为是“坏”序列。我想数好事/坏事。 在我看来,它可以作为记录计算后的记录(即任何A记录由1个指示符给出。如果B记录在A记录之后,指标为1,否则为0)。 有没有办法在没有任何UDF的猪身上实现它? 如果没有,有人可以建议如何写一个蟒蛇吗?

谢谢, 迈克尔。

0 个答案:

没有答案