标签: python pyspark
我有一个pyspark数据框,其列为 [日期,时间,ad_id] ,其中ad_id-广告ID。我需要计算广告展示的天数(换句话说,计算按ad_id分组的行之间的持续时间),然后将此新列添加到数据框中。 我应该更好地使用什么功能?