DASK Pivot_Table和Pandas Pivot_Table Python之间的区别

时间:2018-10-08 01:18:14

标签: python python-3.x pandas pivot-table dask

似乎我们可以使用两个库中的pivot_table来实现相同的目标,但是对于大型数据集,哪种方法在性能上更有效?

1 个答案:

答案 0 :(得分:1)

绝对是黄昏。大熊猫的工作方式是,将所有内容作为内存中的整体块处理,并且不可并行处理,而Dask则将数据帧分解为可以并行处理的块。