时间序列累积和的Pythonic代码

时间:2017-10-27 07:14:55

标签: python pandas datetime python-datetime

我有一个带有Date_of_Purchase列的pandas数据框,其中包含许多datetime个值:

dop_phev = rebates[rebates['Vehicle_Type']=='Plug-in Hybrid']['Date_of_Purchase']
dop_phev

输出:

0     2015-07-20
1     2015-07-20
3     2015-07-20
4     2015-07-24
5     2015-07-24
     ...    
502   2017-09-16
503   2017-09-18
504   2017-06-14
505   2017-09-21
506   2017-09-22
Name: Date_of_Purchase, Length: 383, dtype: datetime64[ns]`

我想制作一个累积购买图y,与日期x。我开始研究一个解决方案,在这个解决方案中,我遍历每个日期并计算所有日期,而不是那个日期,但它绝对是一个"非pythonic"解。我怎样才能用pythonic代码实现这个目标?

编辑:我不确定它会是什么样子,但这是我目前的解决方案:

dop_phev = rebates[rebates['Vehicle_Type']=='Plug-in Hybrid']['Date_of_Purchase']
cum_count = np.zeros(len(dop_phev.unique()))
for i, date in enumerate(dop_phev.unique()):
    cum_count[i] = sum(dop_phev<date)
plt.plot(dop_phev.unique(),cum_count)

这并不是很有效......

作为参考,我正在研究this dataset关于电动汽车折扣的问题。您可以在我的GitHub repo here上找到CSV数据。

1 个答案:

答案 0 :(得分:1)

您可以使用Series.groupby,然后使用Series.plot

dop_phev = dop_phev.groupby(dop_phev).apply(lambda x: sum(dop_phev<x.name))
print (dop_phev)
2015-07-20    0
2015-07-24    3
2017-06-14    5
2017-09-16    6
2017-09-18    7
2017-09-21    8
2017-09-22    9
Name: Date_of_Purchase, dtype: int64

dop_phev.plot()