为什么numpy masked_array上的sum()操作会将填充值更改为1e20?

时间:2013-09-18 18:06:50

标签: python numpy

这是一个功能还是一个错误?有人可以向我解释这个numpy masked_array的行为吗?它似乎在应用求和操作后更改了fill_value,如果您打算使用填充结果,这会让人感到困惑。

data=ones((5,5))
m=zeros((5,5),dtype=bool)

"""Mask out row 3"""
m[3,:]=True
arr=ma.masked_array(data,mask=m,fill_value=nan)

print arr
print 'Fill value:', arr.fill_value
print arr.filled()


farr=arr.sum(axis=1)
print farr
print 'Fill value:', farr.fill_value
print farr.filled()

"""I was expecting this"""
print nansum(arr.filled(),axis=1)

打印输出:

[[1.0 1.0 1.0 1.0 1.0]
 [1.0 1.0 1.0 1.0 1.0]
 [1.0 1.0 1.0 1.0 1.0]
 [-- -- -- -- --]
 [1.0 1.0 1.0 1.0 1.0]]
Fill value: nan
[[  1.   1.   1.   1.   1.]
 [  1.   1.   1.   1.   1.]
 [  1.   1.   1.   1.   1.]
 [ nan  nan  nan  nan  nan]
 [  1.   1.   1.   1.   1.]]
[5.0 5.0 5.0 -- 5.0]
Fill value: 1e+20
[  5.00000000e+00   5.00000000e+00   5.00000000e+00   1.00000000e+20
   5.00000000e+00]
[  5.   5.   5.  nan   5.]

1 个答案:

答案 0 :(得分:2)

arr.sum返回的数组是一个新数组,它不会继承arr的fill_value(尽管我同意这可能是np.ma的一个很好的改进)。作为解决方法,您可以使用

In [18]: farr.filled(arr.fill_value)
Out[18]: array([  5.,   5.,   5.,  nan,   5.])