我尝试导入带有熊猫的.csv 30分钟时间序列文件,以将其重新采样为小时,但是重新采样功能无法识别日期时间格式。
下面是我当前使用的代码,日期和时间在.csv文件中是分开的列,并由脚本合并到“ datetime”中。 .csv由8列和5131行组成。
def dateparse(d,t):
dt = d + " " + t
return pd.datetime.strptime(dt, '%d/%m/%Y %H:%M:%S')
df = pd.read_csv(infile, parse_dates={'datetime': ['date', 'time']}, date_parser=dateparse)
df.resample('H').mean()
有人遇到这个问题吗?
答案 0 :(得分:0)
首先将数据框的索引设置为datetime
列,将其转换为日期时间索引,它应该可以工作。
def dateparse(d,t):
dt = d + " " + t
return pd.datetime.strptime(dt, '%d/%m/%Y %H:%M:%S')
df = pd.read_csv(infile, parse_dates={'datetime': ['date', 'time']}, date_parser=dateparse)
df = df.set_index('datetime')
df.index = pd.to_datetime(df.index)
df.resample('H').mean()