您好,我正在尝试通过使用311-service-requests.csv获得此结果。 有创建日期和关闭日期列。我利用这些列的差值来找到close_time_hours。我也发现投诉类型计数。
这是我的代码: enter image description here
import pandas as pd
import numpy as np
complaints = pd.read_csv("311-service-requests.csv", sep = ",")
complaint_counts = complaints['Complaint Type'].value_counts().sort_values(ascending=False).head(10)
print(complaint_counts)
start_time = pd.to_datetime(complaints['Created Date'].astype(str))
end_time = pd.to_datetime(complaints['Closed Date'].astype(str))
complaints['diff_seconds'] = end_time - start_time
complaints['diff_seconds'] = complaints['diff_seconds']/np.timedelta64(1, 'h')
diff_time= complaints.groupby("Complaint Type")["diff_seconds"].mean()
print(pd.concat([complaint_counts, diff_time], axis=1).head(10))
这是我的结果:enter image description here
路灯状况= -18.893000。看,这里的时间差是负值。为什么会这样?结束时间不能小于开始时间。因此结果必须是肯定的。我想这是因为数据框缺少值。