尝试使用OpenDAP打开一系列netCDF文件

时间:2019-03-25 00:14:22

标签: dask netcdf python-xarray noaa

我想使用xarray和open_mfdataset打开1950-2005年的所有数据。 https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface/catalog.html

这是我到目前为止所做的:

source = https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface/air.sig995.years.nc

    files = [source for years in range(1950,2005,1)]
    ds=xr.open_mfdataset(files)
    print(ds)

但是,我似乎无法将我的列表解释为被读入源中的可变年份。

有什么想法吗?

谢谢。

编辑:     path = 'https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface' files = ['{0}/air.sig995.{1:04d}.nc'.format(path, years) for years in range(1950,2005,1)] print(files) nc = netCDF4.MFDataset(files)

这是我正在使用的代码。当我尝试打开这些文件时,出现错误:

OSError: [Errno -90] NetCDF: file not found: b'https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface/air.sig995.1948.nc'

我输入的路径不正确吗?

1 个答案:

答案 0 :(得分:0)

所有文件都命名为air.sig995.YYYY.nc,因此您需要类似以下内容:

files = ['air.sig995.{0:04d}.nc'.format(years) for years in range(1950,2005,1)]

哪个会产生:

In [2]: files
Out[2]: 
['air.sig995.1950.nc',
 'air.sig995.1951.nc',
 'air.sig995.1952.nc',
 'air.sig995.1953.nc',
 .....

您也可以在此处轻松添加(远程)路径(如果需要):

path = '/some/file/path'
files = ['{0}/air.sig995.{1:04d}.nc'.format(path, years) for years in range(1950,2005,1)]

有关Python中字符串格式的更多信息,请参见https://pyformat.info/