使用pandas,我导入了一个包含所有不同类型数据的CSV文件。我想得到一系列日期的平均值与时间(到达时间)和一系列时间(持续时间)。这怎么可能。我认为问题是将系列更改为字符串,并将转换形式hh:mm:ss更改为实数。
使用pandas,我的csv文件如下所示:
感谢您的帮助!
答案 0 :(得分:0)
1)切出dataFrame的一列
2)执行列表理解以将时间戳转换为自纪元以来的秒数(将浮动)
3)计算平均值
4)转换回日期时间
这是一行(加上导入):
import time
import datetime
from statistics import mean
df = # your existing dataFrame
avg_arrival_time = datetime.fromtimestamp(mean([time.mktime(x.timetuple()) for x in df['Arrival_time']]))