我想在每日基础上规范化时间序列。 现在我的代码如下:
for date in set(df.index.date):
print('Date: ' + str(date))
df[df.index.date == date] = df[df.index.date == date].div(df[df.index.date == date].abs().max())
print('Normalization Done')
我工作正常,但速度很慢。你知道一些更好的方法吗? 也许一些地图功能或列表理解?直到现在,他还没弄明白该怎么做。
答案 0 :(得分:0)
您可以将数据框重新采样为天,并对所有值求和,这将为您提供每天的标准化值。然后,您可以将其重新采样回原始数据帧的索引,并进行简单除法。
以下代码行将达到目的:
df / df.resample('D').sum().asof(df.index)