按顺序排列SQL / Spark SQL组

时间:2018-01-23 18:14:37

标签: sql apache-spark-sql

我有一个包含列的表:

  • IP
  • 时间戳

通过这些,我设法获得了另外两列:

  • previousTimestamp(来自同一IP的前一行的时间戳)
  • timestampDiffInMinutes(时间戳与previousTimestamp之间的分钟差异)

enter image description here 现在我需要添加一个名为“SessionId”的列,该列标识每个IP地址以及相隔30分钟的每个连续时间戳的周期。也就是说,我想获得以下专栏:

带有SessionId列的表 enter image description here

所以基本上,每当timeDiffInMinutes高于30或NULL时,我想创建一个新的SessionId。

我该怎么做?

0 个答案:

没有答案