我正在尝试构建一个数据框,在其中我可以看到创建日期和完成日期之间的比率。
import pandas as pd
import numpy as np
import json
file = ('test31.csv')
df = pd.read_csv(file)
df = df[['Incident', 'Created Date', 'Finished Date']]
df = df.sort_values(by=['Created Date', 'Finished Date'])
df.head()
Output:
Incident Created Date Finished Date
XY11 2020-06-01 2020-06-12
AA12 2020-06-01 2020-06-12
AA12 2020-06-01 2020-06-16
AA12 2020-06-06 2020-06-17
XY11 2020-06-09 2020-06-22
现在,我想找出在日期期间活动的“ XY11”类型的事件有多少。因此,如果XY11是在2020-06-01年创建的,则它的计数应为+1,并且在关闭(完成)后,计数器应减少1。
这是我的尝试
x = df.groupby(['Incident', 'Created Date'])['Created Date'].count()
y = df.groupby(['Incident', 'Finished Date'])['Finished Date'].count()
print(x)
print(y)
X Output:
Incident Created Date
XY11 2020-06-01 2
XY11 2020-06-01 1
XY11 2020-06-01 2
XY11 2020-06-06 1
AA12 2020-06-09 4
AA12 2020-06-11 3
y Output:
Incident Finished Date
XY11 2020-06-12 2
XY11 2020-06-01 2
XY11 2020-06-01 1
XY11 2020-06-06 1
AA12 2020-06-09 4
AA12 2020-06-11 1
现在我要做的是合并并找出日期之间的比率,以便我可以在多系列折线图中表示数据。
因此,当事件被创建时,该行将上升,并且当事件被报告为已完成时,它将下降。