我有一个非常庞大的数据帧,我需要平均15秒的间隔。正如您所看到的,索引不是时间戳,所以基本上我需要做的是重新对TS列(时间戳)进行采样。到目前为止,我一直在使用matplotlib.dates.num2date(table.index),但这非常耗时,有时会给我带来内存错误。无论如何我可以使用重新采样和其他列吗?此外,如果有更快的方式每15秒平均一次比重新采样,请告诉我。相关代码如下。
import pandas as pd
import numpy as np
import matplotlib.dates as pltd
>>> table[TS]
735381.370833 2014-05-28 08:54:00
735381.379109 2014-05-28 09:05:55
735381.379155 2014-05-28 09:05:59
735381.380556 2014-05-28 09:08:00
735381.382014 2014-05-28 09:10:06
735381.407407 2014-05-28 09:46:40
table.index = pltd.num2date(table.index)
table = table.resample('15S')
table.index = pltd.date2num(table.index.to_pydatetime())