Dask总值是否具有开始和结束时间的固定范围?

时间:2017-05-14 05:33:18

标签: pandas range aggregate dask

在dask甚至是pandas中你将如何将具有3列时间/等级/扩展的dask数据帧按时间分组到一组固定范围内。

时间仅用于移动一个方向。像一个循环计数。那么最终的结果是开始时间和结束时间是高水平,低水平,水平的第一个值和水平的最后一个值超过固定范围?实施例

12:00:00, 10, 1
12:00:01, 11, 1
12:00:02, 12, 1
12:00:03, 11, 1
12:00:04, 9,  1
12:00:05, 6,  1
12:00:06, 10, 1
12:00:07, 14, 1
12:00:08, 11, 1
12:00:09, 7,  1
12:00:10, 13, 1
12:00:11, 8,  1

对于(7)的固定水平范围。因此,从开始到结束的级别对于每个级别的bin,从开始到结束的总距离不能超过7。仅仅因为第一个bin只有8个时间差而第二个只有2个不同的时间,这个剂量并不是从高到低剂量的高到低剂量,而不是通过7个固定的盒子大小。在下面的示例中,第一个箱可以是5个而不是8个用于第一个箱,200个用于下一个箱而不是2个。因此,dask中的前几行看起来像这样。

第一次,上次,高级别,低级别,第一级别,最后一级,点差

12:00:00, 12:00:07, 13, 6, 10, 13, 1
12:00:07, 12:00:09, 14, 7, 13, 7, 1
12:00:09, X, 13, 7, X, X, X

如果在每次水平移动到X以上或者在X或X以下等于过高/过低时,如何在dask中使用水平向前移动的修正窗口进行聚合?

0 个答案:

没有答案