假设我遇到以下情况:
ddf1.known_divisions
虽然True
ddf2.known_divisions
False
为ddf2
,但我希望在for i in range(ddf1.npartitions):
print(i, len(ddf1.get_partition(i)), len(ddf2.get_partition(i)))
0 27 50
1 29 0
2 23 21
3 21 29
数据框上保留相同的分部。
在一个随机的例子中,我甚至得到了一个空分区。
int