更新不在磁盘上的大型DataFrame对象。

时间:2013-05-28 10:04:00

标签: python pandas csv hdf5 large-data

我一直在通过操纵在线获得的大型csv文件来了解熊猫的来龙去脉,这些文件是财务数据的时间序列。到目前为止,我已经想出了如何使用HDFStore来存储和操作它们,但是我想知道是否存在更新文件的更简单方法,而无需重新下载整个源文件?

我问,因为我正在处理12~300 + MB文件,每15分钟更新一次。虽然我不需要更新是连续的,但是不要下载我已经拥有的内容。

1 个答案:

答案 0 :(得分:1)

来自BlazeContinuum库可以为您提供帮助。您可以找到简介here