如何计算许多行和指标之间的时差?

时间:2018-11-26 20:19:58

标签: r hadoop hive

我有不同的标志的历史信息,用于确定何时应该启动计时器和停止计时器,然后才能评估是否需要采取措施。

我的桌子类似于:

Location ID ActionTime      Action
1           11/13/18 0:06   Start
1           11/13/18 0:07   Start
1           11/13/18 0:08   Unnecessary Info
1           11/13/18 0:09   **End**
1           11/15/18 0:06   Start
1           11/15/18 0:07   Unnecessary Info
1           11/15/18 0:07   **Done**
2           11/13/18 0:06   Start
2           11/13/18 0:07   Unnecessary Info
2           11/13/18 0:07   **Done**
3           11/13/18 0:06   Start
3           11/13/18 0:10   **Complete**
4           11/13/18 0:06   Start

我正在尝试获取:

Location ID ActionTime      Action Length
1           11/13/18 0:06   03:00.0
1           11/15/18 0:06   01:00.0
2           11/13/18 0:06   01:00.0
3           11/13/18 0:06   04:00.0

我认为滞后不会起作用,因为滞后取决于行从何处开始,然后移至下一个第n行-这些行每周不同,并且在开始和结束之间可能有很多点。

在开始/结束期间内可以开始(以我的示例为位置ID 1)。而且可能有没有明确停止的开始-在这一点上,我将排除这些停止或以其他方式识别它们以进行单独的操作。

0 个答案:

没有答案