Python:使用h5py和NumPy从MATLAB .mat文件读取str时出现问题

时间:2019-02-13 00:21:35

标签: python string matlab numpy h5py

我很难将MATLAB .mat文件中的'str'变量'Et'(Endtime)和'St'(Starttime)加载到Python中。

我想要与MATLAB中相同的输出。相反,我遇到了尝试解决此问题的问题。有关Python代码和输出,请参见下文。

# Import numpy and h5py to load in .mat files
import numpy as np
import h5py 

# Load in Matlab ('-v7.3') data
fname = 'directory/file.mat'
f = h5py.File(fname,'r') 

# create dictionary for data
data= {"average":np.array(f.get('average')),"median":np.array(f.get('median')), \
             "stdev":np.array(f.get('stdev')),"P10":np.array(f.get('p10')), \
             "P90":np.array(f.get('p90')),"St":np.str(f.get('stime')), \
             "Et":np.str(f.get('etime'))}
# All other variables are arrays

print(data["Et"])

输出:

<HDF5 dataset "etime": shape (1, 6), type "<u4">

我希望python中的字符串等于MATLAB中的字符串。 换句话说,我想要print(data [“ Et”])='01011212000000'这是日期和时间。

我该如何解决?

MATLAB中的数据示例: example

3 个答案:

答案 0 :(得分:1)

当我需要加载.mat时,我使用scipy,它可以正常工作。 试试这个:

import scipy.io
mat = scipy.io.loadmat('fileName.mat')

我认为它会起作用。 祝你好运。

答案 1 :(得分:1)

在八度音阶中

>> x = 1:10;
>> y = reshape(1:12, 3,4);
>> et = '0101121200000';
>> xt = 'a string';
>> save -hdf5 testh5.mat x y et xt

在一个小小的会话中:

In [130]: f = h5py.File('testh5.mat','r')
In [131]: list(f.keys())
Out[131]: ['et', 'x', 'xt', 'y']
In [132]: list(f['y'].keys())
Out[132]: ['type', 'value']
In [133]: f['x/type'].value
Out[133]: b'range'
In [134]: f['y/type'].value
Out[134]: b'matrix'
In [135]: f['y/value'].value
Out[135]: 
array([[ 1.,  2.,  3.],
       [ 4.,  5.,  6.],
       [ 7.,  8.,  9.],
       [10., 11., 12.]])
In [136]: f['et/type'].value
Out[136]: b'sq_string'
In [137]: f['et/value'].value
Out[137]: 
array([[48],
       [49],
       [48],
       [49],
       [49],
       [50],
       [49],
       [50],
       [48],
       [48],
       [48],
       [48],
       [48]], dtype=int8)
In [138]: f['et/value'].value.ravel().view('S13')
Out[138]: array([b'0101121200000'], dtype='|S13')
In [139]: f['xt/value'].value.ravel().view('S8')
Out[139]: array([b'a string'], dtype='|S8')
In [140]: f.close()

how to import .mat-v7.3 file using h5py

Opening a mat file using h5py and convert data into a numpy matrix

====

bytes也可以在我的文件中使用

In [220]: bytes(f['xt/value'].value)
Out[220]: b'a string'
In [221]: bytes(f['et/value'].value)
Out[221]: b'0101121200000'

答案 2 :(得分:1)

如果您不介意存储在etime中的stimefile.mat的变量类型,则可以将它们存储为char类型而不是string ,您可以通过bytes(f.get(your_variable).value).decode('utf-8')用Python阅读它们。就您而言:

data = {
    "average": np.array(f.get('average')),
    "median": np.array(f.get('median')),
    "stdev": np.array(f.get('stdev')),
    "P10": np.array(f.get('p10')),
    "P90": np.array(f.get('p90')),
    "St": bytes(f.get('stime')[:]).decode('utf-8'),
    "Et": bytes(f.get('etime')[:]).decode('utf-8')
}

我确定还有一种读取string类型的方法,但这可能是最简单的解决方案。