将带有整数键的字典转换为numpy数组

时间:2015-12-15 23:59:48

标签: python numpy dictionary

我有一个字典定义如下:

>>> nparray[[4,0]] = [obj3,obj0]
>>> nparray[[7,4]] = [obj4,obj3]

字典有整数作为键。

我正在尝试将此dict转换为numpy数组。

这样:

class MyArray (dict):
    def __init__ (self,*args):
        dict.__init__(self,*args)
    def __getitem__ (self, key):
        if not hasattr (key, '__iter__'):
            return dict.__getitem__ (self,key)
        return List([dict.__getitem__ (self,k) for k in key])

我知道numpy结构化数组但不幸的是,似乎整数索引必须对应于数组中的位置而不是键。有没有办法改变这种行为。

我正在考虑采用'#34;技巧" numpy数组。例如,它不是读取[4,0]而是读取与这些键对应的行。

我的最终目标是拥有某种继承自np.ndarray的自定义类,如果没有另一种选择。

更新

更多背景,我最初通过使用下面的类来解决这个问题,它存储了对象:

services.AddIdentity<ApplicationUser, IdentityRole>()

允许多键索引。 密钥阵列可能非常大(1000000+),因此密钥中的可能需要很长时间和/或昂贵。我想使用numpy数组来利用它的速度,更低的内存等等。并且不必使用它来进行循环。 还有必要吗?

1 个答案:

答案 0 :(得分:2)

让我们做字典;这里我的obj是元组(仅为方便起见):

In [563]: mydict={0:(0,),5:(1,),4:(3,),7:(4,)}
In [564]: mydict
Out[564]: {0: (0,), 4: (3,), 5: (1,), 7: (4,)}

初始化一个足够大的数组,dtype = object:

In [565]: A=np.empty((8,),dtype=object)    
In [566]: A
Out[566]: array([None, None, None, None, None, None, None, None], dtype=object)

使用键作为数组索引,将值从mydict复制到A

In [567]: for k in mydict:
   .....:     A[k]=mydict[k]
   .....:     

In [568]: A
Out[568]: array([(0,), None, None, None, (3,), (1,), None, (4,)], dtype=object)

In [574]: A[[4,0]]
Out[574]: array([(3,), (0,)], dtype=object)
In [575]: A[[7,4]]
Out[575]: array([(4,), (3,)], dtype=object)

字典中定义的项目现在出现在数组中的相应插槽中。我不会声称这有用。

我可以屏蔽nones

In [581]: Am=np.ma.masked_array(A)
In [582]: Am.mask=[False,True,True,True,False,False,True,False]

In [583]: Am
Out[583]: 
masked_array(data = [(0,) -- -- -- (3,) (1,) -- (4,)],
             mask = [False  True  True  True False False  True False],
       fill_value = ?)

nones仍在那里,只是'隐藏'。我不知道屏蔽是否对对象类型有用。

子类词典

从评论中可以看出,您想要的主要功能是能够从字典中选择多个项目,类似于数组A[[0,3,5]]索引。

继承dict可能比扩展或子类np.ndarray更容易。

scipy.sparse有一个稀疏矩阵格式,它是dict的子类。它__getitem__可以提供有关如何扩展自己的词典的想法。我会尝试提出一个更简单的版本。

同时,获取一组键的一种方法是使用如下表达式:

In [646]: {k:mydict[k] for k in mydict if k in {0,4}}
Out[646]: {0: (0,), 4: (3,)}

或更简单

In [647]: {k:mydict[k] for k in [0,4]}
Out[647]: {0: (0,), 4: (3,)}

但更强大:

In [649]: {k:mydict.get(k,None) for k in [0,4,5,10]}
Out[649]: {0: (0,), 4: (3,), 5: (1,), 10: None}