无法将.mat文件读入python

时间:2018-05-15 21:59:50

标签: python hdf5 mat h5py

我已经尝试了好几天,在我的python项目中寻找正确的方法来读取这个文件。这是一个普通的matlab数据结构文件。

https://drive.google.com/open?id=1E1w1eQn6pTcQ1lkhGMJzmB5ugtmaDPht

我熟悉如何读取h5文件,这个.mat文件似乎就是这种情况,因为它不允许scipy.loadmat读取它。所以我使用了h5py.Read()。

import h5py
f = h5py.File('./imgIdx.mat','r')
d = f['imgIdx/anno']
print(d[1000])     # accessing an arbitrary object

[<HDF5 object reference>]

这是我无法处理的对象 这应该是m×4矩阵 其中m> = 0

1 个答案:

答案 0 :(得分:1)

来自文档中object reference部分的提示: http://docs.h5py.org/en/latest/refs.html

In [348]: d = f['imgIdx/anno']
In [349]: d[1000]
Out[349]: array([<HDF5 object reference>], dtype=object)
In [350]: d[1000].item()
Out[350]: <HDF5 object reference>
In [351]: f[d[1000].item()]
Out[351]: <HDF5 dataset "N4": shape (4, 2), type "<f8">
In [352]: f[d[1000].item()][:]
Out[352]: 
array([[ 87., 447.],
       [158., 160.],
       [446., 586.],
       [325., 283.]])

我还在shell中使用h5dump来查看文件及其内容。