显然,dask 中不存在上升关键字,这很有趣,因为 dask 被设计为类似于熊猫。这不起作用:
res = ddf.groupby(['An important column']).mean().sort_values('Score', ascending=False).compute()
使用 dask 进行降序排序的最佳方法是什么?
<块引用>NotImplementedError:不支持升序=关键字
dask 2021.4.0
答案 0 :(得分:1)
如果延迟结果很小(适合工作/客户端内存)并且有一个不涉及大量数据混洗的任务图,那么通常可以先运行.compute
(将延迟的value 到 pandas df),然后运行缺失/未实现的函数。
例如,这可以按如下方式完成:
res = ddf.groupby(['An important column']).mean().compute().sort_values('Score', ascending=False)