我有一个尺寸为400 * 800 * 3的3D数组。我想用第三维的平均值替换该维度的平均值。现在我已经能够通过使用循环来实现这一目标。
test_data=np.random.randint(0,256,size=(400,800,3))
for i in range(400):
for j in range(800):
mn = np.mean(test_data[i,j])
test_data[i,j]=mn
我想知道是否有一种有效且不那么冗长的方法来实现同一目标。感谢。
另外,如果不是平均值,我想要三个元素的加权平均值,即最后一行应该替换为
test_data[i,j,0]=test_data[i,j,0]*0.2
test_data[i,j,1]=test_data[i,j,1]*0.5
test_data[i,j,2]=test_data[i,j,2]*0.3
答案 0 :(得分:3)
获取最后一个轴的平均值,并使用[:]
-
test_data[:] = test_data.mean(axis=-1,keepdims=1)
或者,我们可以创建一个沿最后一个轴复制的新数组 -
mean_vals = test_data.mean(axis=-1,keepdims=1).astype(test_data.dtype)
test_data_out = np.repeat(mean_vals,3,axis=-1)
对于只读版本和更快的方法,请使用np.broadcast_to
-
test_data_out = np.broadcast_to(mean_vals, test_data.shape)
对于加权平均部分,如果您的意思是:
test_data[i,j]= test_data[i,j,0]*0.2 + test_data[i,j,1]*0.5 + test_data[i,j,2]*0.3
为此,我们可以使用多调度张量减少:np.tensordot
-
W = [0.2,0.5,0.3] # weights
W_mean = np.tensordot(test_data,W, axes=((-1,-1)))[...,None]
test_data[:] = W_mean.astype(test_data.dtype)
相反,如果你的意思是:
test_data[i,j,0]=test_data[i,j,0]*0.2
test_data[i,j,1]=test_data[i,j,1]*0.5
test_data[i,j,2]=test_data[i,j,2]*0.3
为此,没有sum-reduction
,所以我们可以简单地使用broadcasting
-
test_data[:] = (test_data*[0.2, 0.5, 0.3]).astype(test_data.dtype)
答案 1 :(得分:0)
这应该有效:
test_data[:,:,0] += test_data[:,:,1]
test_data[:,:,0] += test_data[:,:,2]
test_data[:,:,0] *= 1.0/3
test_data[:,:,1] = test_data[:,:,0]*0.5
test_data[:,:,2] = test_data[:,:,0]*0.3
test_data[:,:,0] *= 0.2
这种方法可以“就地”工作而不需要额外的内存
答案 2 :(得分:0)
In [556]: test_data=np.arange(24.).reshape(2,4,3)
In [557]: test_data
Out[557]:
array([[[ 0., 1., 2.],
[ 3., 4., 5.],
[ 6., 7., 8.],
[ 9., 10., 11.]],
[[ 12., 13., 14.],
[ 15., 16., 17.],
[ 18., 19., 20.],
[ 21., 22., 23.]]])
沿最后一个维度缩放值只是一个乘法:
In [558]: test_data*np.array([0.2, 0.5, 0.3])
Out[558]:
array([[[ 0. , 0.5, 0.6],
[ 0.6, 2. , 1.5],
[ 1.2, 3.5, 2.4],
[ 1.8, 5. , 3.3]],
[[ 2.4, 6.5, 4.2],
[ 3. , 8. , 5.1],
[ 3.6, 9.5, 6. ],
[ 4.2, 11. , 6.9]]])
可以使用test_data *= np.array([....])
在最后一个维度上取平均值只是:
In [559]: test_data.mean(axis=-1)
Out[559]:
array([[ 1., 4., 7., 10.],
[ 13., 16., 19., 22.]])
这是2d。 @divakar已经展示了如何保持3d(keep_dims
)甚至全尺寸(2,4,1)甚至(2,4,3)。
In [561]: test_data.mean(axis=-1,keepdims=True)
Out[561]:
array([[[ 1.],
[ 4.],
[ 7.],
[ 10.]],
[[ 13.],
[ 16.],
[ 19.],
[ 22.]]])
np.average
可让您指定权重(加权平均值):
In [568]: np.average(test_data, axis=-1, weights=[0.2,0.5,0.3])
Out[568]:
array([[ 1.1, 4.1, 7.1, 10.1],
[ 13.1, 16.1, 19.1, 22.1]])
这与在最后一维上拍摄点积
相同In [569]: np.dot(test_data, [0.2,0.5,0.3])
Out[569]:
array([[ 1.1, 4.1, 7.1, 10.1],
[ 13.1, 16.1, 19.1, 22.1]])