在Python中读取.mat文件。但是数据的形状发生了变化

时间:2016-09-01 06:33:06

标签: python matlab numpy file-io mat-file

 % save .mat file in the matlab    
train_set_x=1:50*1*51*61*23;   
train_set_x=reshape(train_set_x,[50,1,51,61,23]);   
save(['pythonTest.mat'],'train_set_x','-v7.3');

在matlab中获得的数据大小为(50,1,51,61,23)。

我使用此link的指令在Python中加载.mat文件。

代码如下:

import numpy as np, h5py
f = h5py.File('pythonTest.mat', 'r')
train_set_x = f.get('train_set_x')
train_set_x = np.array(train_set_x)

train_set_x.shape的输出为(23L, 61L, 51L, 1L, 50L)。预计为(50L, 1L, 51L, 61L, 23L)。所以我改变了形状

train_set_x=np.transpose(train_set_x, (4,3,2,1,0))

我很好奇Python和matlab之间数据形状的变化。我的代码中是否有错误?

1 个答案:

答案 0 :(得分:4)

您的代码中没有任何错误。 Matlab和python在处理多维数组的方式上存在根本区别 Matalb和python都将多维数组的所有元素存储为内存中的单个连续块。区别在于元素的顺序:
Matlab ,(与fortran一样)以列优先的方式存储元素,即根据数组的维度存储元素,用于2D:

 [1 3;
  2 4]

相比之下, Python ,以行优先的方式存储元素,即从数组的 last 维度开始:

[1 2;
 3 4];

因此,在Matlab中使用 size [m,n,k]的内存块被python视为 shape [k,n,m]的数组。

有关详细信息,请参阅this wiki page

BTW,您可以尝试将其订单设置为" Fortran"而不是转置train_set_x。 order(col-major,如Matlab):

 train_set_x = np.array(train_set_x, order='F')