我有一个多维的对象数组,如:
a = np.array([obj1,obj2,obj3])
对象是具有多个属性的类的实例。让我们说其中一个是高度,其中一个是长度。为了获得相应的长度和高度的多维数组,我做了:
lengths = np.array([obj1.length,obj2.length,obj3.length])
heights = np.array([obj1.height,obj2.height,obj3.height])
这开始使我的代码变得非常混乱。有更有效的方法吗?例如,我有类似
的东西 heights = a.height
记住,但很明显它不起作用,因为a是我的对象数组,而不是我的对象。但有什么类似我可以做的有效和pythonic?我试过像这样的东西
for x in np.nditer(a,flags=['refs_ok']):
print x.length
看看会发生什么,但它不起作用,因为nditer以某种方式返回一个元组。
有什么想法吗?
答案 0 :(得分:1)
你可以vectorize这个功能:
>>> import numpy
>>>
>>> class Obj(object):
... def __init__(self, x, y):
... self.x = x
... self.y = y
...
>>> arr = numpy.array([Obj(1, 2), Obj(3, 4), Obj(5, 6)])
>>>
>>> vectorized_x = numpy.vectorize(lambda obj: obj.x)
>>>
>>> vectorized_x(arr)
array([1, 3, 5])
虽然我不确定你是否应该首先存储一个NumPy Python对象数组。 Vectorize并不比Python循环更有效。存储(n + 1)-D数组会更有效,因为我们可以简单地通过切片来提取内容,这是一种原生操作,例如
>>> a = numpy.array([[(1, 2), (3, 4), (5, 6)], [(7, 8), (9, 10), (11, 12)], [(-13, -14), (-15, -16), (-17, -18)]])
>>> a[:,:,0]
array([[ 1, 3, 5],
[ 7, 9, 11],
[-13, -15, -17]])
>>> a[:,:,1]
array([[ 2, 4, 6],
[ 8, 10, 12],
[-14, -16, -18]])