如何合并两个数据框?

时间:2020-06-28 11:58:10

标签: python pandas dataframe

enter image description here

您好,我正在尝试通过使用311-service-requests.csv获得此结果。 有创建日期和关闭日期列。我利用这些列的差值来找到close_time_hours。我也发现投诉类型计数。

这是我的代码: enter image description here

import pandas as pd
import numpy as np

complaints = pd.read_csv("311-service-requests.csv", sep = ",")
complaint_counts = complaints['Complaint Type'].value_counts().sort_values(ascending=False).head(10)
print(complaint_counts)

start_time = pd.to_datetime(complaints['Created Date'].astype(str))
end_time = pd.to_datetime(complaints['Closed Date'].astype(str))

complaints['diff_seconds'] = end_time - start_time
complaints['diff_seconds'] = complaints['diff_seconds']/np.timedelta64(1, 'h')
diff_time= complaints.groupby("Complaint Type")["diff_seconds"].mean()

print(pd.concat([complaint_counts, diff_time], axis=1).head(10))

这是我的结果:enter image description here

路灯状况= -18.893000。看,这里的时间差是负值。为什么会这样?结束时间不能小于开始时间。因此结果必须是肯定的。我想这是因为数据框缺少值。

0 个答案:

没有答案