在dask甚至是pandas中你将如何将具有3列时间/等级/扩展的dask数据帧按时间分组到一组固定范围内。
时间仅用于移动一个方向。像一个循环计数。那么最终的结果是开始时间和结束时间是高水平,低水平,水平的第一个值和水平的最后一个值超过固定范围?实施例
12:00:00, 10, 1
12:00:01, 11, 1
12:00:02, 12, 1
12:00:03, 11, 1
12:00:04, 9, 1
12:00:05, 6, 1
12:00:06, 10, 1
12:00:07, 14, 1
12:00:08, 11, 1
12:00:09, 7, 1
12:00:10, 13, 1
12:00:11, 8, 1
对于(7)的固定水平范围。因此,从开始到结束的级别对于每个级别的bin,从开始到结束的总距离不能超过7。仅仅因为第一个bin只有8个时间差而第二个只有2个不同的时间,这个剂量并不是从高到低剂量的高到低剂量,而不是通过7个固定的盒子大小。在下面的示例中,第一个箱可以是5个而不是8个用于第一个箱,200个用于下一个箱而不是2个。因此,dask中的前几行看起来像这样。
第一次,上次,高级别,低级别,第一级别,最后一级,点差
12:00:00, 12:00:07, 13, 6, 10, 13, 1
12:00:07, 12:00:09, 14, 7, 13, 7, 1
12:00:09, X, 13, 7, X, X, X
如果在每次水平移动到X以上或者在X或X以下等于过高/过低时,如何在dask中使用水平向前移动的修正窗口进行聚合?