Question

我有一个hdf5文件'example.h5'。该文件有一个名为“master”的父组。 'master'有多个子组，这些子组是数据表，例如data_1，data_2，data_3 ......等等。

我正在尝试使用pandas的read_hdf来读取data_1表，但似乎无法解决主组在读取文件和调用我想要阅读的特定表之间的问题。这样做的目的是我想使用read_hdf的'where'参数读取特定值：

如果我尝试读取整个数据存储区，我将得到以下内容：

from pandas import read_hdf
hdf = read_hdf('example.h5')


ValueError: No dataset in HDF5 file

然后，如果我试图分支到'主'组：

from pandas import read_hdf
hdf = read_hdf('example.h5','master')

TypeError: cannot create a storer if the object is not existing nor a value are passed

理想情况下，我可以这样做：

from pandas import read_hdf
hdf = read_hdf('example.h5','master/data_1')

唯一的问题是我不知道如何实施。所以问题是如何访问hiearchy中较低的hdf组，以便我可以使用'where'参数快速访问特定数据？

理想的解决方案如下：

hdf = read_hdf('example.h5','master/data_1',where=['A>10'], columns=['A','B']))

熊猫阅读HDF - 处理Hiearchy

0 个答案: