Numpy apply_along_axis没有返回ndarray子类

时间:2016-06-30 20:17:02

标签: python numpy multidimensional-array

我有一个ndarray子类,__array_wrap__已正确实现,np.apply_along_axis不返回我的子类的实例,而是返回ndarrays。下面的代码复制了我的问题:

import numpy as np

class MySubClass(np.ndarray):

    def __new__(cls, input_array, info=None):
        obj = np.asarray(input_array).view(cls)
        obj.info = info
        return obj

    def __array_finalize__(self, obj):
        if obj is None: return
        self.info = getattr(obj, 'info', None)

    def __array_wrap__(self, out_arr, context=None):
        return np.ndarray.__array_wrap__(self, out_arr, context)

sample_ndarray = np.array([[0,5],[2.1,0]]) 
sample_subclass = MySubClass(sample_ndarray, info="Hi Stack Overflow")

# Find the smallest positive (>0) number along the first axis
min_positive = np.apply_along_axis(lambda x: np.min(np.extract(x>0,x)),
                                   0, sample_subclass)

# No more info
print hasattr(min_positive, 'info')
# Not a subclass
print isinstance(min_positive, MySubClass)
# Is an ndarray
print isinstance(min_positive, np.ndarray)

我能找到的最相关的问题是this one,但似乎已经达成共识__array_wrap__需要实施,我已经完成了。此外,np.extractnp.min都按预期返回子类,只是在使用apply_along_axis时才会看到此行为。

有没有办法让我的代码返回我的子类? 我正在使用numpy版本1.11.0

1 个答案:

答案 0 :(得分:1)

查看apply_along_axis代码(通过Ipython ??)

Type:        function
String form: <function apply_along_axis at 0xb5a73b6c>
File:        /usr/lib/python3/dist-packages/numpy/lib/shape_base.py
Definition:  np.apply_along_axis(func1d, axis, arr, *args, **kwargs)
Source:
def apply_along_axis(func1d, axis, arr, *args, **kwargs):
...
    outarr = zeros(outshape, asarray(res).dtype)
    outarr[tuple(ind)] = res
....
    return outarr

我跳过了很多详细信息,但基本上它使用np.zerosshape以及dtype,但不会调整数组子类。

许多numpy函数将操作委托给数组的方法,或者使用_wrapit_wrapit(a, 'take', indices, axis, out, mode))。

你真的需要使用apply_along_axis吗?这没有什么神奇之处。您可以在自己的代码中执行相同的迭代,同样快。

===================

以下是2个apply_along_axis示例和替代实现。它们对于有意义的时间来说太小了,我敢肯定它们同样快,如果不是那么快:

In [3]: def my_func(a):
    return (a[0]+a[-1]*0.5)    
In [4]: b=np.arange(1,10).reshape(3,3)

In [5]: np.apply_along_axis(my_func,0,b)
Out[5]: array([ 4.5,  6. ,  7.5])

In [6]: np.apply_along_axis(my_func,1,b)
Out[6]: array([  2.5,   7. ,  11.5])

直接阵列实现:

In [8]: b[0,:]+b[-1,:]*0.5
Out[8]: array([ 4.5,  6. ,  7.5])

In [9]: b[:,0]+b[:,-1]*0.5
Out[9]: array([  2.5,   7. ,  11.5])

第二

In [10]: c=np.array([[8,1,7],[4,3,9],[5,2,6]])

In [11]: np.apply_along_axis(sorted, 1, c)
Out[11]: 
array([[1, 7, 8],
       [3, 4, 9],
       [2, 5, 6]])

In [12]: d=np.zeros_like(c)
In [13]: for i in range(c.shape[0]):
   ....:     d[i,:] = sorted(c[i,:]) 

In [14]: d
Out[14]: 
array([[1, 7, 8],
       [3, 4, 9],
       [2, 5, 6]])

在第一篇文章中,我完全跳过了迭代;在第二个我使用相同的分配和迭代,减少开销。

请查看np.matrixnp.ma,了解如何实施ndarray子类的示例。

np.core.fromnumeric.py作为_wrapit函数,由np.take等函数使用:

# functions that are now methods
def _wrapit(obj, method, *args, **kwds):
    try:
        wrap = obj.__array_wrap__
    except AttributeError:
        wrap = None
    result = getattr(asarray(obj), method)(*args, **kwds)
    if wrap:
        if not isinstance(result, mu.ndarray):
            result = asarray(result)
        result = wrap(result)
    return result

因此,如果obj具有__array_wrap__方法,则会将其应用于数组结果。因此,您可以将其用作包装apply_along_axis的模型来恢复自己的类。