在Numpy Python中向量化这个函数

时间:2013-11-07 07:56:31

标签: python arrays numpy vectorization

我有一个来自0-9的60,000个数字的数组:

In [1]: trainY
Out[1]: 
array([[5],
       [0],
       [4],
       ..., 
       [5],
       [6],
       [8]], dtype=int8)

我有一个函数将trainY中的每个元素转换为10元素向量,如下所示:

0 -> [1,0,0,0,0,0,0,0,0,0]
1 -> [0,1,0,0,0,0,0,0,0,0]
2 -> [0,0,1,0,0,0,0,0,0,0]
3 -> [0,0,0,1,0,0,0,0,0,0]
...
9 -> [0,0,0,0,0,0,0,0,0,1]

功能:

def transform_y(y):
    new_y = np.zeros(10)
    new_y[y] = 1
    return new_y

我的代码一次只能使用1个元素。一次转换trainY数组的最佳方法是什么(除了for循环)?我应该使用map吗?有人还可以告诉我如何重新编写函数,以便它是矢量化的吗?

谢谢。

2 个答案:

答案 0 :(得分:4)

您可以大大提高代码速度,创建一个包含对角线的二维数组,然后根据输入数组提取右行:

a = array([[5],
           [0],
           [4],
           ..., 
           [5],
           [6],
           [8]], dtype=int8)

new_y = np.eye(a.max()+1)[a.ravel()]

更快的解决方案是使用零创建输出数组,然后根据a的索引填充它:

new_y = np.zeros((a.shape[0], a.max()+1))
new_y[np.indices(a.ravel().shape)[0], a.ravel()] = 1.

答案 1 :(得分:3)

您可以使用vectorize装饰器

@np.vectorize
def transform_y(y):
    new_y = np.zeros(10)
    new_y[y] = 1
    return new_y

请参阅http://telliott99.blogspot.ch/2010/03/vectorize-in-numpy.html