如何在pyspark中填写缺少的数据框日期

时间:2019-11-30 22:22:28

标签: pyspark resampling

我在python中有一些代码想要转换为Pyspark。我注意到pyspark不支持set_index。

要使其在Pyspark中运行,我需要进行哪些更改?

    df4 = df3.set_index(['sales_date', 'brand_id', 'customer_id']).\
  unstack([1, 2]).\
  resample('D').asfreq().\
  fillna(0).\
  stack([1, 2]).\
  reset_index()

谢谢

0 个答案:

没有答案