当我使用numpy
实现一些机器学习算法时出现问题。我想要一些新的课程ludmo
与 numpy.ndarray
的工作方式相同,但需要更多属性。例如,使用新属性ludmo.foo
。我已尝试过以下几种方法,但没有一种方法令人满意。
首先,我为numpy.ndarray
创建了一个包装类,为
import numpy as np
class ludmo(object):
def __init__(self)
self.foo = None
self.data = np.array([])
但是当我使用某些函数(在我无法修改的scikit-learn
中)来操作np.ndarray
实例的列表时,我必须首先提取每个{{1}的所有data
字段对象并将它们收集到列表中。之后,列表被排序,我丢失了ludmo
和原始data
对象之间的对应关系。
然后我尝试将ludmo
作为ludmo
的子类,作为
numpy.ndarray
但是出现了另一个问题:创建import numpy as np
class ludmo(np.ndarray):
def __init__(self, shape, dtype=float, buffer=None, offset=0, strides=None, order=None)
super().__init__(shape, dtype, buffer, offset, strides, order)
self.foo = None
对象的最常见方法是numpy.ndarray
,它返回一个numpy.array(some_list)
对象,我必须将其转换为{{1}对象。但到目前为止,我发现没有好办法做到这一点;只需更改numpy.ndarray
属性就会导致错误。
我是Python和numpy的新手,所以必须有一些我不知道的优雅方式。任何建议表示赞赏。
如果有人能提供通用解决方案会更好,这不仅适用于ludmo
类,也适用于各种类。
答案 0 :(得分:4)
作为explained in the docs,您可以将自己的方法添加到np.ndarray
:
import numpy as np
class Ludmo(np.ndarray):
def sumcols(self):
return self.sum(axis=1)
def sumrows(self):
return self.sum(axis=0)
def randomize(self):
self[:] = np.random.rand(*self.shape)
然后使用the np.ndarray.view()
method创建实例:
a = np.random.rand(4,5).view(Ludmo)
使用__array_finalize__()
方法定义新属性:
def __array_finalize__(self, arr):
self.foo = 'foo'
答案 1 :(得分:2)
由于您询问通用解决方案,这里有一个可以使用的通用包装类:(来自http://code.activestate.com/recipes/577555-object-wrapper-class/)
class Wrapper(object):
'''
Object wrapper class.
This a wrapper for objects. It is initialiesed with the object to wrap
and then proxies the unhandled getattribute methods to it.
Other classes are to inherit from it.
'''
def __init__(self, obj):
'''
Wrapper constructor.
@param obj: object to wrap
'''
# wrap the object
self._wrapped_obj = obj
def __getattr__(self, attr):
# see if this object has attr
# NOTE do not use hasattr, it goes into
# infinite recurrsion
if attr in self.__dict__:
# this object has it
return getattr(self, attr)
# proxy to the wrapped object
return getattr(self._wrapped_obj, attr)
这种方式的工作原理是:
例如skicit会调用ludmo.data python实际调用
ludmo.__getattribute__('data')
如果ludmo没有'数据'属性,python会调用
ludmo.__getattr__('data')
通过覆盖您拦截此调用的__getattr__
函数,检查您的ludmo是否具有data
属性(否则,您可能会进入递归),并将调用发送到您的内部对象。因此,您应该已经覆盖了对内部numpy对象的所有可能调用。
<强>更新强>:
你还必须以同样的方式实现__setattr__
,否则你会得到这个
>>> class bla(object):
... def __init__(self):
... self.a = 1
... def foo(self):
... print self.a
...
>>> d = Wrapper(bla())
>>> d.a
1
>>> d.foo()
1
>>> d.a = 2
>>> d.a
2
>>> d.foo()
1
并且您可能还想设置一个新的元类来拦截对新样式类的魔术函数的调用(对于完整的类,请参阅https://github.com/hpcugent/vsc-base/blob/master/lib/vsc/utils/wrapper.py
有关信息,请参阅How can I intercept calls to python's "magic" methods in new style classes?
)
但是,只有在您仍然希望能够访问x.__name__
或x.__file__
并从包装的类而不是您的类中获取魔术属性时才需要这样做。
# create proxies for wrapped object's double-underscore attributes
class __metaclass__(type):
def __init__(cls, name, bases, dct):
def make_proxy(name):
def proxy(self, *args):
return getattr(self._obj, name)
return proxy
type.__init__(cls, name, bases, dct)
if cls.__wraps__:
ignore = set("__%s__" % n for n in cls.__ignore__.split())
for name in dir(cls.__wraps__):
if name.startswith("__"):
if name not in ignore and name not in dct:
setattr(cls, name, property(make_proxy(name)))