我有一个带有时间戳列的数据框(以及"秒"列,fwiw)。我想要的是计算连续块的数量及其长度,其中连续意味着后续条目的差异小于k秒。换句话说,我正在寻找计算差距和运行长度。
差距的数量并不难:
num_gaps = len(np.where(np.diff(np.array(df.seconds)) > k))
但有效地计算跑步长度让我很难过。有什么建议吗?
这很简单,当然,使用iterrows(),效率不高。
答案 0 :(得分:-1)
哦,我是个骗子。运行长度只是间隙数组中的差异(包括0开始和len()结束。