我有一个来自0-9的60,000个数字的数组:
In [1]: trainY
Out[1]:
array([[5],
[0],
[4],
...,
[5],
[6],
[8]], dtype=int8)
我有一个函数将trainY
中的每个元素转换为10元素向量,如下所示:
0 -> [1,0,0,0,0,0,0,0,0,0]
1 -> [0,1,0,0,0,0,0,0,0,0]
2 -> [0,0,1,0,0,0,0,0,0,0]
3 -> [0,0,0,1,0,0,0,0,0,0]
...
9 -> [0,0,0,0,0,0,0,0,0,1]
功能:
def transform_y(y):
new_y = np.zeros(10)
new_y[y] = 1
return new_y
我的代码一次只能使用1个元素。一次转换trainY
数组的最佳方法是什么(除了for循环)?我应该使用map
吗?有人还可以告诉我如何重新编写函数,以便它是矢量化的吗?
谢谢。
答案 0 :(得分:4)
您可以大大提高代码速度,创建一个包含对角线的二维数组,然后根据输入数组提取右行:
a = array([[5],
[0],
[4],
...,
[5],
[6],
[8]], dtype=int8)
new_y = np.eye(a.max()+1)[a.ravel()]
更快的解决方案是使用零创建输出数组,然后根据a
的索引填充它:
new_y = np.zeros((a.shape[0], a.max()+1))
new_y[np.indices(a.ravel().shape)[0], a.ravel()] = 1.
答案 1 :(得分:3)
您可以使用vectorize
装饰器
@np.vectorize
def transform_y(y):
new_y = np.zeros(10)
new_y[y] = 1
return new_y
请参阅http://telliott99.blogspot.ch/2010/03/vectorize-in-numpy.html