在熊猫中使用变量变异分割时间序列

时间:2013-08-07 05:32:15

标签: python pandas

我正在那里(http://db.tt/9SG85XFK)绘制一个pandas数据帧;带有两个变量的'timestamp'索引(绘制为蓝色和绿色曲线)。

我想提取蓝色曲线变量或多或少恒定的数据帧的子集(std.variation低于特定值?)。

因此,对于附图,它将提取3个不同的子集〜(41000:41170,41180:41315和41320:41580)。

有干净的方法吗?我可以通过一个循环来完成它,但是......不确定它是否正确。

谢谢,

<磷>氮

1 个答案:

答案 0 :(得分:1)

您可能需要rolling_std功能的功能。

指定要检查标准差的间隔宽度(比如说100个数据点),选择适当的标准偏差(比方说10)并执行:

 import pandas as pd
 s = pd.Series(the way you get your data)
 std = pd.rolling_std(s, 100)
 selected = s[std < 10]

您将获得100个数据点周围标准差小于10的所有数据点。