根据不同行

时间:2016-09-15 18:28:36

标签: python apache-spark pyspark apache-spark-sql spark-dataframe

This is the sorted data I have

This is the sorted data I have (above)按ID分区,按日期排序,seq。现在根据事件,我想改变价格和大小的价值。 我想每个id只有一行,其中:

  1. 如果最新活动是'添加'或者'修改'然后价格和尺寸将相同。
  2. 但如果事件是“取消”,那么我希望为每个后续取消添加大小,并从最新添加或修改相同ID中减去。并将相同的价格更新为相同身份证的最新添加/修改价格。
  3. 这只是我的样本数据。

0 个答案:

没有答案