覆盖pandas数据帧后,HDF5文件的大小会增加

时间:2015-10-13 11:42:45

标签: python pandas hdf5 pytables

我正在尝试覆盖hdf5文件中的pandas数据帧。每次执行此操作时,文件大小都会增长,而存储的帧内容则相同。如果我使用mode ='w',我丢失了所有其他记录。 这是一个错误还是我错过了什么?

import pandas
df = pandas.read_csv('1.csv')
for i in range(100):
  store = pandas.HDFStore('tmp.h5')
  store.put('TMP', df)
  store.close()

tmp.h5的大小越来越大。

1 个答案:

答案 0 :(得分:5)

阅读此section

底部的重要警告

这就是HDF5的工作原理。