熊猫计算日期之间的比率

时间:2020-07-28 13:04:22

标签: python-3.x pandas dataframe

我正在尝试构建一个数据框,在其中我可以看到创建日期和完成日期之间的比率。

import pandas as pd
import numpy as np
import json


file = ('test31.csv')

df = pd.read_csv(file)
df = df[['Incident', 'Created Date', 'Finished Date']]
df = df.sort_values(by=['Created Date', 'Finished Date'])

df.head()

Output:

Incident        Created Date      Finished Date

XY11           2020-06-01          2020-06-12
AA12           2020-06-01          2020-06-12
AA12           2020-06-01          2020-06-16
AA12           2020-06-06          2020-06-17
XY11           2020-06-09          2020-06-22

现在,我想找出在日期期间活动的“ XY11”类型的事件有多少。因此,如果XY11是在2020-06-01年创建的,则它的计数应为+1,并且在关闭(完成)后,计数器应减少1。

这是我的尝试

x = df.groupby(['Incident', 'Created Date'])['Created Date'].count()
y = df.groupby(['Incident', 'Finished Date'])['Finished Date'].count()

print(x)
print(y)

X Output:

Incident       Created Date     

XY11           2020-06-01       2          
XY11           2020-06-01       1         
XY11           2020-06-01       2        
XY11           2020-06-06       1       

AA12           2020-06-09       4          
AA12           2020-06-11       3



y Output:

Incident       Finished Date     

XY11           2020-06-12       2          
XY11           2020-06-01       2         
XY11           2020-06-01       1        
XY11           2020-06-06       1       

AA12           2020-06-09       4          
AA12           2020-06-11       1

现在我要做的是合并并找出日期之间的比率,以便我可以在多系列折线图中表示数据。

因此,当事件被创建时,该行将上升,并且当事件被报告为已完成时,它将下降。

0 个答案:

没有答案