Candas groupBy()

时间:2017-06-20 14:52:39

标签: python performance pandas cython

我有一些代码可以对不同的数据片段执行一些计算,然后将结果放入多索引的pandas数据帧中。然后,包含数据切片结果的每个数据帧与pandas.concatenate()连接在一起。最后,我使用pandas.groupBy()来折叠这个大数据帧并进行求和。

最近,我对生成结果的代码进行了一些更改,这些结果放入每个数据帧中,然后连接起来。由于这些更改,groupBy()函数运行速度慢得多。通过查看一些基本的分析,似乎groupBy()使用纯Python实现而不是Cython实现。

不幸的是我无法粘贴代码片段或数据。但是,有人可以指出我要检查什么,以找出导致问题的原因吗?例如,数据框中的数据类型都是同类的且可预先确定的吗?

谢谢。

0 个答案:

没有答案