OneHotEncoder之前和之后的结果不同

时间:2018-10-23 14:54:04

标签: python numpy

我使用OneHotEncoder编码了y向量,运行我的神经网络并获得了输出。 这里a代表我的y向量,b代表预测结果

a = np.array([[0., 0., 1., 0.],
       [0., 0., 1., 0.],
       [0., 0., 1., 0.],
       [0., 0., 1., 0.],
       [0., 0., 1., 0.],
       [0., 0., 1., 0.],
       [1., 0., 0., 0.],
       [1., 0., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 1., 0.]])
b=np.array([[0., 0., 0., 1.],
       [1., 0., 0., 0.],
       [0., 0., 1., 0.],
       [0., 1., 0., 0.],
       [1., 0., 0., 0.],
       [0., 0., 1., 0.],
       [0., 0., 1., 0.],
       [1., 0., 0., 0.],
       [0., 0., 0., 1.],
       [0., 1., 0., 0.]])
print(np.mean(a!=b))
print(np.mean(np.argmax(a,1)!=np.argmax(b,1)))

但是在还原编码(使用np.argmax(a,1))之后,我得到了输出:

0.35
0.7

这些值不应该相等吗?

1 个答案:

答案 0 :(得分:2)

您的问题来自a!=b返回一个数组数组,检查每个索引处的元素是否不同的事实。第一个返回一个数组数组,其中第一个值为[False False True True],这意味着对于ab中的第一项,前两个条目是相同的,后两个是不同。请尝试以下操作:

print(a!=b)
>>>[[False False  True  True], [ True False  True False] ...

第二个返回一个比较所需索引的单个数组:

print(np.argmax(a,1)!=np.argmax(b,1))
>>>[ True  True False  True  True False  True False  True  True]