如何创建具有不同形状的多个字段的numpy结构化数组?

时间:2012-09-11 20:51:34

标签: python arrays numpy structure

我刚开始使用numpy数组而且我在创建结构化数组时遇到了麻烦。我想创建类似于Matlab结构的东西,其中字段可以是不同形状的数组。

a=numpy.array([1, 2, 3, 4, 5, 6,]);
b=numpy.array([7,8,9]);
c=numpy.array([10,11,12,13,14,15,16,17,18,19,20]);

##Doesn't do what I want
data=numpy.array([a, b, c],dtype=[('a','f8'),('b','f8'),('c','f8')]);  

我希望data['a']返回矩阵a,data['b']返回矩阵b等。当读取Matlab结构时,数据以这种格式保存,所以我知道它必须是可能的

2 个答案:

答案 0 :(得分:13)

我担心如果不扭动NumPy的手臂就不可能。

请参阅NumPy背后的想法是提供同类数组,即所有具有相同类型的元素数组。这种类型可以很简单(intfloat ...)或更复杂([('',int),('',float),('',"|S10")]),但在任何情况下,所有元素都具有相同的类型。这允许一些非常有效的内存布局。

因此,固有地,结构化数组要求字段(各个子块)具有相同的大小,无论位置如何。检查以下内容:

>>> np.zeros(3,dtype=[('a',(int,3)),('b',(float,5))])

它定义了一个包含三个元素的数组;每个元素由两个子块ab组成; a是一个包含三个intsb一个五个floats的块。但是一旦你在dtype中定义了块的初始大小,你就会坚持下去(,你可以随时切换,但这是另一个故事)。

有一种解决方法:使用dtype=object。这样,您就构建了一个异构项目数组,就像一系列不同大小的列表一样。但是你失去了很多NumPy的力量。还是一个例子:

>>> x=np.zeros(3, dtype=[('a',object), ('b',object)])
>>> x['a'][0] = [1,2,3,4]
>>> x['b'][-1] = "ABCDEF"
>>> print x
[([1, 2, 3, 4], 0) (0, 0) (0, 'ABCD')]

所以,我们刚刚构造了一个......对象数组。我在某处放了一个列表,在其他地方放了一个字符串,它有效。您可以按照相同的示例来构建您想要的数组:

blob = np.array([(a,b,c)],dtype=[('a',object),('b',object),('c',object)])

但是,你应该再三思考它是否真的是你的结果,另一种结构可能会更有效率。

附注:请注意上面表达式的[(a,b,c)]部分:注意()?你基本上是在告诉NumPy构造一个由1个元素组成的数组,这个元素由三个子元素组成(每个子元素对应一个a,b,c),每个子元素都是一个对象。如果你没有放(),NumPy会抱怨很多。

最后一条评论:如果您访问blob['a']这样的字段,您将获得一个大小为(1,)dtype=object的数组:只需使用blob['a'].item()即可获取您原来的(6,) int数组。

答案 1 :(得分:7)

在python中,字典大致类似于Matlab中的结构。您可以尝试以下操作来查看它是否适合您:

>>> data = {'a':a, 'b':b, 'c':c}
>>> data['a'] is a
True