应用错误收集

更新不在磁盘上的大型DataFrame对象。

时间：2013-05-28 10:04:00

标签： python pandas csv hdf5 large-data

我一直在通过操纵在线获得的大型csv文件来了解熊猫的来龙去脉，这些文件是财务数据的时间序列。到目前为止，我已经想出了如何使用HDFStore来存储和操作它们，但是我想知道是否存在更新文件的更简单方法，而无需重新下载整个源文件？

我问，因为我正在处理12~300 + MB文件，每15分钟更新一次。虽然我不需要更新是连续的，但是不要下载我已经拥有的内容。

1 个答案:

答案 0 :(得分：1)

来自Blaze的Continuum库可以为您提供帮助。您可以找到简介here。