如何在Python中创建NetCDF文件时指定维度值?

时间:2017-01-24 10:19:04

标签: python gdal netcdf netcdf4

我正在创建一个目前有四个变量的NetCDF4文件:

1)地表温度(3D阵列 - 时间,纬度,经度)

2)经度(1D - 每个像素中心的坐标)

3)纬度(1D - 每个像素中心的坐标)

4)时间(自1900-01-01 00:00:00以来的小时图像采集时间)

我目前正在使用以下代码执行此操作:

    #==========================WRITE THE NETCDF FILE==========================#

    newfile = nc.Dataset(export_filename, 'w', format = 'NETCDF4_CLASSIC')


    #==========================SET FILE DIMENSIONS============================#

    newfile.createDimension('lat', ny)
    newfile.createDimension('lon', nx)
    newfile.createDimension('time', len(filenames))


    #==========================SET GLOBAL ATTRIBUTES==========================#

    newfile.title = ('Title')
    newfile.history = "File created on " + datetime.strftime(datetime.today(), "%c")
    newfile.Conventions = 'CF-1.6'



    #==========================CREATE DATA VARIABLES==========================#

    #--------------------------LST VARIABLE-----------------------------------#

    LSTs = newfile.createVariable('LST', np.int16, ('time', 'lat', 'lon'), fill_value = -8000)
    LSTs.units = 'Degrees C'
    LSTs.add_offset = 273.15
    LSTs.scale_factor = 0.01
    LSTs.standard_name = 'LST'
    LSTs.long_name = 'Land Surface Temperature'
    LSTs.grid_mapping = 'latitude_longitude'
    LSTs.coordinates = 'lon lat'

    LSTs[:] = LSTd[:]


    #--------------------------LON AND LAT AND TIME--------------------------#

    LONGITUDEs = newfile.createVariable('LONGITUDE', np.float64, ('lon',))
    LONGITUDEs.units = 'Decimal Degrees East'
    LONGITUDEs.standard_name = 'Longitude'
    LONGITUDEs.long_name = 'Longitude'
    LONGITUDEs[:] = LONd[:]

    LATITUDEs = newfile.createVariable('LATITUDE', np.float64, ('lat',))
    LATITUDEs.units = 'Decimal Degrees North'
    LATITUDEs.standard_name = 'Latitude'
    LATITUDEs.long_name = 'Latitude'
    LATITUDEs[:] = LATd[:]

    TIMEs = newfile.createVariable('TIME', np.int32, ('time',))
    TIMEs.units = 'hours since 1900-01-01 00:00:00'
    TIMEs.standard_name = 'Time'
    TIMEs.long_name = 'Time of Image Acquisition'
    TIMEs.axis = 'T'
    TIMEs.calendar = 'gregorian'
    TIMEs[:] = time[:]

    #--------------------------SAVE THE FILE---------------------------------#

    newfile.close();

此代码生成一个netCDF文件,其地表温度变量有24个波段(一天中每小时一个)。这段代码正如我所希望的那样,尽管我想解决一个小问题。当我为LST变量运行gdalinfo时,我得到(这是一个简化版本):

Band 1.....
...
NETCDF_DIM_TIME = 1
...

我希望将此值1设置为与我在上面的代码中包含的'time'变量(自1900-01-01 00:00:00以来的1081451小时)相同。 因此,我想了解如何为文件中的每个频段更改此内容?

更新问题:当我对文件执行gdalinfo时(再次,子集):

NETCDF_DIM_EXTRA={time}
NETCDF_DIM_time_DEF={24,3}

但是有一个选项缺少'NETCDF_DIM_time_VALUES',我需要将其设置为时间变量,它应该工作。 我该怎么做?

目前它只是被设置为乐队号码,但我希望它包含有关其获取时间的信息。

更新1:

我试图指定

LSTs.NETCDF_DIM_Time = time

在netCDF文件形成期间,这已经将所有值从时间分配给gdal中的NETCDF_DIM_TIME,这样每个波段都有24个时间值而不是一个。

更新2:

通过进一步的挖掘,我认为需要将NETCDF_DIM_time_VALUES元数据设置为'time'变量。我已经更新了我的问题,询问如何做到这一点。

1 个答案:

答案 0 :(得分:2)

与尺寸关联的变量应与尺寸具有相同的名称。因此,在上面的代码中,将创建变量行替换为:

TIMEs = newfile.createVariable('time', np.int32, ('time',))

现在gdalinfo知道在哪里找到数据。我使用虚拟时间[1000000,1000024]运行代码,gdal信息返回:

Band1...
...
NETCDF_DIM_time=1000000    
...
Band2...
...
NETCDF_DIM_time=1000024
...

要回答标题问题:您无法为维度分配值,但您可以拥有一个与包含与维度相关联的数据/值的维度同名的变量。 netcdf文件的读者,如gdal,寻找这样的约定来解释数据。请参阅示例Unidata's 'Writing NetCDF Files: Best Practices' 'Coordinate Systems'