在Dask中使用尚未实现的熊猫函数

时间:2019-06-01 16:10:50

标签: python pandas dask dask-distributed dask-delayed

我相信我在Dask教程之一中看到了关于使用Dask数据帧时如何使用尚未在Dask框架中实现的Pandas函数的建议,但是我似乎错位了。例如,我想使用熊猫函数“ ewm”。

作为一种解决方法,我将Dask数据帧转换为Pandas数据帧,在Pandas数据帧上运行ewm,然后将其转换回Dask,以进行以后的内存密集型操作。不是最有效的。

有更好的策略吗?

1 个答案:

答案 0 :(得分:1)

可以使用各种较低级别的通用函数来构建Dask Dataframe函数,例如<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <title>Document</title> <script src="script.js"></script> </head> <body> <div id='demo'> <p>Paragraph 1</p> <p>Paragraph 2</p> </div> </body> </html>,自定义聚合,滚动等。

这里有更多信息:https://docs.dask.org/en/latest/best-practices.html#learn-techniques-for-customization