在连接后保留Dask数据帧中的分区

时间:2017-07-18 17:15:28

标签: python dask

假设我遇到以下情况:

ddf1.known_divisions

虽然True ddf2.known_divisions Falseddf2,但我希望在for i in range(ddf1.npartitions): print(i, len(ddf1.get_partition(i)), len(ddf2.get_partition(i))) 0 27 50 1 29 0 2 23 21 3 21 29 数据框上保留相同的分部。 在一个随机的例子中,我甚至得到了一个空分区。

int

0 个答案:

没有答案