当我使用dask.dataframe时,如何指定行顺序

时间:2018-04-11 04:21:50

标签: python pandas dask

我有两个形状相同的数据框 我尝试转换为dask数据帧,指定相同的select m.id, m.col1, coalesce(t.message, 'Defaultmsg') as message from master m left join table1 t on m.id = t.mapping_id 但是,每个数据帧如何分割成分区似乎不同,如下图所示 有谁知道如何指定数据帧应如何分离?

enter image description here

1 个答案:

答案 0 :(得分:0)

这是一个猜测:索引值似乎是排序的,但一个是数字和一个词典;即,我怀疑你的数据帧mrt_dask有一个包含字符串的索引,而不是数字。如果是这样,那么在将astype传递给dask之前调用它应该可以解决您的问题,或者您可能应该首先更改它的加载方式。