Python:如何使用最少的代码行扩展一个庞大的类?

时间:2015-03-02 07:21:51

标签: python arrays class inheritance numpy

原始问题描述

当我使用numpy实现一些机器学习算法时出现问题。我想要一些新的课程ludmo numpy.ndarray的工作方式相同,但需要更多属性。例如,使用新属性ludmo.foo。我已尝试过以下几种方法,但没有一种方法令人满意。

1。包装

首先,我为numpy.ndarray创建了一个包装类,为

import numpy as np

class ludmo(object):
    def __init__(self)
        self.foo = None
        self.data = np.array([])

但是当我使用某些函数(在我无法修改的scikit-learn中)来操作np.ndarray实例的列表时,我必须首先提取每个{{1}的所有data字段对象并将它们收集到列表中。之后,列表被排序,我丢失了ludmo和原始data对象之间的对应关系。

2。继承

然后我尝试将ludmo作为ludmo的子类,作为

numpy.ndarray

但是出现了另一个问题:创建import numpy as np class ludmo(np.ndarray): def __init__(self, shape, dtype=float, buffer=None, offset=0, strides=None, order=None) super().__init__(shape, dtype, buffer, offset, strides, order) self.foo = None 对象的最常见方法是numpy.ndarray,它返回一个numpy.array(some_list)对象,我必须将其转换为{{1}对象。但到目前为止,我发现没有好办法做到这一点;只需更改numpy.ndarray属性就会导致错误。

我是Python和numpy的新手,所以必须有一些我不知道的优雅方式。任何建议表示赞赏。

如果有人能提供通用解决方案会更好,这不仅适用于ludmo类,也适用于各种类。

2 个答案:

答案 0 :(得分:4)

作为explained in the docs,您可以将自己的方法添加到np.ndarray

import numpy as np

class Ludmo(np.ndarray): 
    def sumcols(self):
        return self.sum(axis=1)

    def sumrows(self):
        return self.sum(axis=0)

    def randomize(self):
        self[:] = np.random.rand(*self.shape)

然后使用the np.ndarray.view() method创建实例:

a = np.random.rand(4,5).view(Ludmo)

使用__array_finalize__()方法定义新属性:

def __array_finalize__(self, arr):
    self.foo = 'foo'

答案 1 :(得分:2)

由于您询问通用解决方案,这里有一个可以使用的通用包装类:(来自http://code.activestate.com/recipes/577555-object-wrapper-class/

class Wrapper(object):
    '''
    Object wrapper class.
    This a wrapper for objects. It is initialiesed with the object to wrap
    and then proxies the unhandled getattribute methods to it.
    Other classes are to inherit from it.
    '''
    def __init__(self, obj):
        '''
        Wrapper constructor.
        @param obj: object to wrap
        '''
        # wrap the object
        self._wrapped_obj = obj

    def __getattr__(self, attr):
        # see if this object has attr
        # NOTE do not use hasattr, it goes into
        # infinite recurrsion
        if attr in self.__dict__:
            # this object has it
            return getattr(self, attr)
        # proxy to the wrapped object
        return getattr(self._wrapped_obj, attr)

这种方式的工作原理是:

例如skicit会调用ludmo.data python实际调用 ludmo.__getattribute__('data') 如果ludmo没有'数据'属性,python会调用 ludmo.__getattr__('data')

通过覆盖您拦截此调用的__getattr__函数,检查您的ludmo是否具有data属性(否则,您可能会进入递归),并将调用发送到您的内部对象。因此,您应该已经覆盖了对内部numpy对象的所有可能调用。

<强>更新: 你还必须以同样的方式实现__setattr__,否则你会得到这个

>>> class bla(object):
...  def __init__(self):
...   self.a = 1
...  def foo(self):
...   print self.a
...
>>> d = Wrapper(bla())
>>> d.a
1
>>> d.foo()
1
>>> d.a = 2
>>> d.a
2
>>> d.foo()
1

并且您可能还想设置一个新的元类来拦截对新样式类的魔术函数的调用(对于完整的类,请参阅https://github.com/hpcugent/vsc-base/blob/master/lib/vsc/utils/wrapper.py 有关信息,请参阅How can I intercept calls to python's "magic" methods in new style classes? ) 但是,只有在您仍然希望能够访问x.__name__x.__file__并从包装的类而不是您的类中获取魔术属性时才需要这样做。

# create proxies for wrapped object's double-underscore attributes
    class __metaclass__(type):
        def __init__(cls, name, bases, dct):

            def make_proxy(name):
                def proxy(self, *args):
                    return getattr(self._obj, name)
                return proxy

            type.__init__(cls, name, bases, dct)
            if cls.__wraps__:
                ignore = set("__%s__" % n for n in cls.__ignore__.split())
                for name in dir(cls.__wraps__):
                    if name.startswith("__"):
                        if name not in ignore and name not in dct:
                            setattr(cls, name, property(make_proxy(name)))