如何按降序对dask数据框进行排序?

时间:2021-04-21 04:10:36

标签: python dask

显然,dask 中不存在上升关键字,这很有趣,因为 dask 被设计为类似于熊猫。这不起作用:

res = ddf.groupby(['An important column']).mean().sort_values('Score', ascending=False).compute()

使用 dask 进行降序排序的最佳方法是什么?

<块引用>

NotImplementedError:不支持升序=关键字

dask 2021.4.0

1 个答案:

答案 0 :(得分:1)

如果延迟结果很小(适合工作/客户端内存)并且有一个不涉及大量数据混洗的任务图,那么通常可以先运行.compute(将延迟的value 到 pandas df),然后运行缺失/未实现的函数。

例如,这可以按如下方式完成:

res = ddf.groupby(['An important column']).mean().compute().sort_values('Score', ascending=False)