标签: python pandas csv hdf5 large-data
我一直在通过操纵在线获得的大型csv文件来了解熊猫的来龙去脉,这些文件是财务数据的时间序列。到目前为止,我已经想出了如何使用HDFStore来存储和操作它们,但是我想知道是否存在更新文件的更简单方法,而无需重新下载整个源文件?
我问,因为我正在处理12~300 + MB文件,每15分钟更新一次。虽然我不需要更新是连续的,但是不要下载我已经拥有的内容。
答案 0 :(得分:1)
来自Blaze的Continuum库可以为您提供帮助。您可以找到简介here。