HDF5与Pandas中的Panel或Panel4D

时间:2015-03-12 02:06:18

标签: python pandas panel hdf5

在pandas中,可以将数据保存在多个数据帧的Panel中。该小组甚至可以是4D或更高的维度。保存数据时,可以保存为HDF5格式,这允许内部目录结构,具有嵌套目录。因此,完全可以在单个目录下存储多个数据帧,类似于在一个Panel中保存多个数据帧的方式。

何时应该在HDF5中使用Panel vs.嵌套目录?

我正在编写和阅读许多相同大小的小表/数据帧,使用不同的参数集生成。我一直在使用Panels和Panel4D组织它们,然后将整个Panel保存到HDF5文件中的表中。回读数据时,我通常希望最终使用所有数据帧,但在任何时候我实际上只使用其中一个数据帧。就我目前的目的而言,这似乎都不重要;数据帧很小,因此在整个Panel中读取并不麻烦。但是,如果其他不使用pandas的人试图读取HDF5文件,他们将更难以访问和理解数据。 我应该考虑哪些其他因素?

0 个答案:

没有答案