我正在那里(http://db.tt/9SG85XFK)绘制一个pandas数据帧;带有两个变量的'timestamp'索引(绘制为蓝色和绿色曲线)。
我想提取蓝色曲线变量或多或少恒定的数据帧的子集(std.variation低于特定值?)。
因此,对于附图,它将提取3个不同的子集〜(41000:41170,41180:41315和41320:41580)。
有干净的方法吗?我可以通过一个循环来完成它,但是......不确定它是否正确。
谢谢,
<磷>氮答案 0 :(得分:1)
您可能需要rolling_std
功能的功能。
指定要检查标准差的间隔宽度(比如说100个数据点),选择适当的标准偏差(比方说10)并执行:
import pandas as pd
s = pd.Series(the way you get your data)
std = pd.rolling_std(s, 100)
selected = s[std < 10]
您将获得100个数据点周围标准差小于10的所有数据点。