这里非常棘手。我有一个运行不同加载作业的数据仓库。我批量加载了所有的工作。我有所有加载作业的时间,并希望有一种方法以编程方式找出将加载作业分成不同批次的最佳方法,使它们在同一时间内完成。
我的数据如下:
NAME TIME
AA_1 13:52.9
AA_2 10:37.8
AA_3 10:10.6
AA_4 09:07.7
AA_5 08:22.9
AA_6 04:29.3
AA_7 04:14.4
AA_8 03:56.3
AA_9 03:11.4
AA_10 02:59.3
作为一个例子,如果我拿AA_1和AA_2,那么他们的运行时间将在24分钟左右。如果我认为AA_3,AA_4和AA_6也会在24分钟左右。
所以基本上我希望能够指定我希望将它分成n
个批次,然后让程序计算出最好的分组。
有什么想法?我很高兴用Python或SQL来做。
由于