为什么我创建的NETcdf数据被屏蔽?

时间:2018-10-10 13:48:17

标签: python netcdf netcdf4

我用一些数据创建了一个netcdf文件,当我在另一个脚本中导入数据时,它被屏蔽了:

    >>> type(Data[:])
    <class 'numpy.ma.core.MaskedArray'>

这是我创建数据的方式:

    # Put in a grid
    print 'Putting the data in a grid...'
    LatRange = range( int(min(Lat)), int(max(Lat)), 1 )
    LonRange = np.arange( int(min(Lon)), int(max(Lon)), 1 )
    dRange = range(0,200,10) + range(200,4000,100)
    dateRange = np.arange( float(min(Dates).year)+min(Dates).month/12., float(max(Dates).year)+max(Dates).month/12., 1./12. )

    dataset = Dataset('gridded_data/DataAveraged.nc','w', format='NETCDF4_CLASSIC')
    zD = dataset.createDimension('zD',len(dRange))
    latD = dataset.createDimension('latD',len(LatRange))
    lonD = dataset.createDimension('lonD',len(LonRange))
    timeD = dataset.createDimension('timeD',len(dateRange))

    tempAve = dataset.createVariable('tempAve', np.float32, ('zD','latD','lonD','timeD'), fill_value=-9999)
    tempAve.units = 'psu'
    tempAve[:] = Tgrid_ave

其中Tgrid_ave是一个numpy数组。

然后,我以这种方式在另一个脚本中导入数据:

    dataset = Dataset('gridded_data/DataAveraged.nc', 'r')

    LatRange = dataset.variables['lat'][:]
    LonRange = dataset.variables['lon'][:-1]

    Tgrid_ave = dataset.variables['tempAve']

我的纬度和经度数据没有被屏蔽,但是我的Tgrid_ave数据却被屏蔽。

如何避免这种情况!?

1 个答案:

答案 0 :(得分:0)

用于返回掩码数组或常规Numpy数组的netCDF4库,取决于您从数组(或数组切片)中请求的数据是否包含填充值。这是不幸的行为,但似乎已在PR 787中修复。因此,我认为从1.4版开始,默认行为始终是:如果定义了填充值(我尚未测试过),则始终返回带掩码的数组。

无论如何,通过将set_auto_mask设置为False,可以确保始终获得常规的numpy数组。