我正在寻找perl,python甚至LISP中的开源库来处理时间序列数据。数据将从CSV文件中读取:数据运行长度通常为两年每10分钟。任何人都可以推荐一个允许我将数据加载到对象中的库,例如,从数据集中“排除13:00到19:00之间的所有星期日”,或者方便地创建一个包含我想要排除的所有句点的对象。对原始数据集的AND操作。每个时间样本必须能够处理多个值集。
我见过蟒蛇的大熊猫,它看起来很有前途,还有其他人想到了吗?
答案 0 :(得分:2)
熊猫当然是一个很好的方式。 R语言也对时间序列有很好的支持。
from pandas import Series, date_range
from numpy.random import randn
rng = date_range('1/1/2011', periods=10000, freq='10min')
ts = Series(randn(len(rng)), index=rng)
filtered_index = rng[((rng.dayofweek!=6) | ((rng.hour < 13) | (rng.hour>=19)))]
no_sunday_afternoons = ts[filtered_index]
print no_sunday_afternoons['2011-01-02 12:30:00':'2011-01-02 19:30:00']
2011-01-02 12:30:00 -1.395918
2011-01-02 12:40:00 0.382604
2011-01-02 12:50:00 -0.422495
2011-01-02 19:00:00 -0.341497
2011-01-02 19:10:00 0.982950
2011-01-02 19:20:00 -0.909796
2011-01-02 19:30:00 0.842446
dtype: float64