我有一个数据帧,我使用以下命令存储在HDF文件中:
# store data in HDF5 format
store = pd.HDFStore('data.h5')
store.put('data',data)
store.close()
一切正常。 在另一个代码中,我再次加载数据帧,这也工作正常,并在添加两列后再次存储它。
加载:
df = pd.read_hdf('data.h5', key=None, mode='r')
再次保存:
store = pd.HDFStore('data.h5')
store.put('data',data)
store.close()
但是,第二次保存时,我收到以下警告:
PerformanceWarning:你的表现可能会受到PyTables的影响 pickle对象类型,它不能直接映射到c类型 [inferred_type-> mixed,key-> block3_values] [items-> ['a','b','c']]
如果是self.run_code(代码,结果):
有趣的是,警告并不是指两个添加的列,而是指第一次完全保存并且未触及代码的列。 pd.read_hdf
对列类型有什么作用吗?或者我错过了什么?
谢谢