我在两个numpy数组中有一些数据。
a = [1, 2, 3, 4, 5, 6, 7]
b = [1, 2, 3, 5, 5, 6, 7]
我说数组a
是我的计算结果,数组b
是真实的结果值。我想计算结果中的错误百分比。
现在我可以遍历两个数组并比较它们0
如果值匹配,1
表示不匹配,然后将它们相加,除以总值并计算百分比误差。
有没有更快更优雅的方法呢?
答案 0 :(得分:16)
首先使用a
计算b
和a != b
不同的位置,然后找出这些值的平均值:
>>> import numpy as np
>>> a = np.array([1, 2, 3, 4, 5, 6, 7])
>>> b = np.array([1, 2, 3, 5, 5, 6, 7])
>>> error = np.mean( a != b )
>>> error
0.14285714285714285
答案 1 :(得分:4)
有些事情:
>>> a = np.array([1, 2, 3, 5, 5, 6, 7])
>>> b = np.array([1, 2, 3, 4, 5, 6, 7])
>>> (a != b).sum()/float(a.size)
0.14285714285714285
更新我很好奇为什么这个稍微更快:
a = np.random.randint(4, size=1000)
b = np.random.randint(4, size=1000)
timeit('from __main__ import a, b; (a != b).sum()/float(a.size)', number=10000)
# 0.42409151163039496
timeit('from __main__ import a, b, np; np.mean(a != b)', number=10000)
# 0.5342614773662717