如果我有一个已编入索引的Dask数据框
>>> A.divisions
(None, None)
>>> A.npartitions
1
我想设置分区,到目前为止我正在做
A.reset_index().set_index("index", divisions=sorted(divisions))
因为A.repartition(divisions=sorted(divisions))
抱怨“旧的和新的分歧的左侧是不同的”。还有更好的方法吗?
答案 0 :(得分:2)
从getAdapterPosition()
开始,如果您碰巧知道现有数据框的划分,则可以直接指定它们。
dask.__version__ == '0.16.0'