识别pandas数据帧中的连续子序列

时间:2014-12-12 10:32:41

标签: python python-3.x pandas

我有一个带有时间戳列的数据框(以及"秒"列,fwiw)。我想要的是计算连续块的数量及其长度,其中连续意味着后续条目的差异小于k秒。换句话说,我正在寻找计算差距和运行长度。

差距的数量并不难:

num_gaps = len(np.where(np.diff(np.array(df.seconds)) > k))

但有效地计算跑步长度让我很难过。有什么建议吗?

这很简单,当然,使用iterrows(),效率不高。

1 个答案:

答案 0 :(得分:-1)

哦,我是个骗子。运行长度只是间隙数组中的差异(包括0开始和len()结束。