如何使用h5py导入.mat-v7.3文件

时间:2017-09-04 22:17:13

标签: python matlab hdf5 h5py hdf5storage

我的.mat文件有3个矩阵A,B,C。

实际上我使用scipy.io来导入这个mat文件,如下所示。

data = sio.loadmat('/data.mat')
A = data['A']
B = data['B']
C = data['C']

但是,v7.3文件无法使用这种方式导入。 所以,我尝试使用h5py导入,但我不知道如何使用h5py。 我的代码如下。

f = h5py.File('/data.mat', 'r')
A = f.get('/A')
A = np.array('A')

哪一部分错了? 谢谢!

1 个答案:

答案 0 :(得分:2)

在Octave

>> A = [1,2,3;4,5,6];
>> B = [1,2,3,4];
>> save -hdf5 abc.h5 A B

在Ipython中

In [138]: import h5py
In [139]: f = h5py.File('abc.h5')
In [140]: list(f.keys())
Out[140]: ['A', 'B']
In [141]: list(f['A'].keys())
Out[141]: ['type', 'value']
In [142]: f['A']['value']
Out[142]: <HDF5 dataset "value": shape (3, 2), type "<f8">
In [143]: A = f['A']['value'][:]
In [144]: A
Out[144]: 
array([[ 1.,  4.],
       [ 2.,  5.],
       [ 3.,  6.]])

另见侧栏中的链接。

基本上,这是找到所需数据集,然后按http://docs.h5py.org/en/latest/high/dataset.html#reading-writing-data

中所述加载它的问题。

https://pypi.python.org/pypi/hdf5storage/0.1.14 - 这个包有MATLAB MAT v7.3 file support。我还没用过它。

In [550]: import hdf5storage
In [560]: bar = hdf5storage.read(filename='abc.h5')
In [561]: bar
Out[561]: 
array([ ([(b'matrix', [[ 1.,  4.], [ 2.,  5.], [ 3.,  6.]])], [(b'matrix', [[ 1.], [ 2.], [ 3.], [ 4.]])])],
      dtype=[('A', [('type', 'S7'), ('value', '<f8', (3, 2))], (1,)), ('B', [('type', 'S7'), ('value', '<f8', (4, 1))], (1,))])

因此文件已作为结构化数组加载,形状为(1,)和2个字段,'A'和'B'(2个变量名称)。每个都有一个'类型'和'值'字段。

In [565]: bar['A']['value']
Out[565]: 
array([[[[ 1.,  4.],
         [ 2.,  5.],
         [ 3.,  6.]]]])

或使用其loadmat

In [570]: out = hdf5storage.loadmat('abc.h5',appendmat=False)
In [571]: out
Out[571]: 
{'A': array([(b'matrix', [[ 1.,  4.], [ 2.,  5.], [ 3.,  6.]])],
       dtype=[('type', 'S7'), ('value', '<f8', (3, 2))]),
 'B': array([(b'matrix', [[ 1.], [ 2.], [ 3.], [ 4.]])],
       dtype=[('type', 'S7'), ('value', '<f8', (4, 1))])}

out是一本字典:

In [572]: out['B']['value']
Out[572]: 
array([[[ 1.],
        [ 2.],
        [ 3.],
        [ 4.]]])

对于阅读简单的MATLAB文件,这并没有增加太多。它可能会添加更多细胞或结构。但是对于编写MATLAB兼容文件,它应该是一个很大的帮助(尽管写一个可以坚持使用scipy.io.savemat)。