我有一个字典定义如下:
>>> nparray[[4,0]] = [obj3,obj0]
>>> nparray[[7,4]] = [obj4,obj3]
字典有整数作为键。
我正在尝试将此dict转换为numpy数组。
这样:
class MyArray (dict):
def __init__ (self,*args):
dict.__init__(self,*args)
def __getitem__ (self, key):
if not hasattr (key, '__iter__'):
return dict.__getitem__ (self,key)
return List([dict.__getitem__ (self,k) for k in key])
我知道numpy结构化数组但不幸的是,似乎整数索引必须对应于数组中的位置而不是键。有没有办法改变这种行为。
我正在考虑采用'#34;技巧" numpy数组。例如,它不是读取[4,0]而是读取与这些键对应的行。
我的最终目标是拥有某种继承自np.ndarray的自定义类,如果没有另一种选择。
更新
更多背景,我最初通过使用下面的类来解决这个问题,它存储了对象:
services.AddIdentity<ApplicationUser, IdentityRole>()
允许多键索引。 密钥阵列可能非常大(1000000+),因此密钥中的可能需要很长时间和/或昂贵。我想使用numpy数组来利用它的速度,更低的内存等等。并且不必使用它来进行循环。 还有必要吗?
答案 0 :(得分:2)
让我们做字典;这里我的obj
是元组(仅为方便起见):
In [563]: mydict={0:(0,),5:(1,),4:(3,),7:(4,)}
In [564]: mydict
Out[564]: {0: (0,), 4: (3,), 5: (1,), 7: (4,)}
初始化一个足够大的数组,dtype = object:
In [565]: A=np.empty((8,),dtype=object)
In [566]: A
Out[566]: array([None, None, None, None, None, None, None, None], dtype=object)
使用键作为数组索引,将值从mydict
复制到A
:
In [567]: for k in mydict:
.....: A[k]=mydict[k]
.....:
In [568]: A
Out[568]: array([(0,), None, None, None, (3,), (1,), None, (4,)], dtype=object)
In [574]: A[[4,0]]
Out[574]: array([(3,), (0,)], dtype=object)
In [575]: A[[7,4]]
Out[575]: array([(4,), (3,)], dtype=object)
字典中定义的项目现在出现在数组中的相应插槽中。我不会声称这有用。
我可以屏蔽nones
。
In [581]: Am=np.ma.masked_array(A)
In [582]: Am.mask=[False,True,True,True,False,False,True,False]
In [583]: Am
Out[583]:
masked_array(data = [(0,) -- -- -- (3,) (1,) -- (4,)],
mask = [False True True True False False True False],
fill_value = ?)
nones
仍在那里,只是'隐藏'。我不知道屏蔽是否对对象类型有用。
从评论中可以看出,您想要的主要功能是能够从字典中选择多个项目,类似于数组A[[0,3,5]]
索引。
继承dict
可能比扩展或子类np.ndarray
更容易。
scipy.sparse
有一个稀疏矩阵格式,它是dict的子类。它__getitem__
可以提供有关如何扩展自己的词典的想法。我会尝试提出一个更简单的版本。
同时,获取一组键的一种方法是使用如下表达式:
In [646]: {k:mydict[k] for k in mydict if k in {0,4}}
Out[646]: {0: (0,), 4: (3,)}
或更简单
In [647]: {k:mydict[k] for k in [0,4]}
Out[647]: {0: (0,), 4: (3,)}
但更强大:
In [649]: {k:mydict.get(k,None) for k in [0,4,5,10]}
Out[649]: {0: (0,), 4: (3,), 5: (1,), 10: None}