在Dask数据帧中的现有索引上设置分区

时间:2017-12-16 21:33:34

标签: dask

如果我有一个已编入索引的Dask数据框

>>> A.divisions
(None, None)
>>> A.npartitions
1

我想设置分区,到目前为止我正在做

A.reset_index().set_index("index", divisions=sorted(divisions))

因为A.repartition(divisions=sorted(divisions))抱怨“旧的和新的分歧的左侧是不同的”。还有更好的方法吗?

1 个答案:

答案 0 :(得分:2)

getAdapterPosition()开始,如果您碰巧知道现有数据框的划分,则可以直接指定它们。

dask.__version__ == '0.16.0'