Pandas Dataframe重新采样

时间:2015-07-27 12:43:12

标签: python pandas matplotlib

我有一个非常庞大的数据帧,我需要平均15秒的间隔。正如您所看到的,索引不是时间戳,所以基本上我需要做的是重新对TS列(时间戳)进行采样。到目前为止,我一直在使用matplotlib.dates.num2date(table.index),但这非常耗时,有时会给我带来内存错误。无论如何我可以使用重新采样和其他列吗?此外,如果有更快的方式每15秒平均一次比重新采样,请告诉我。相关代码如下。

import pandas as pd
import numpy as np
import matplotlib.dates as pltd

>>> table[TS]
735381.370833   2014-05-28 08:54:00
735381.379109   2014-05-28 09:05:55
735381.379155   2014-05-28 09:05:59
735381.380556   2014-05-28 09:08:00
735381.382014   2014-05-28 09:10:06
735381.407407   2014-05-28 09:46:40

table.index = pltd.num2date(table.index)
table = table.resample('15S')
table.index = pltd.date2num(table.index.to_pydatetime())

0 个答案:

没有答案