我想使用xarray和open_mfdataset打开1950-2005年的所有数据。 https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface/catalog.html
这是我到目前为止所做的:
source = https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface/air.sig995.years.nc
files = [source for years in range(1950,2005,1)]
ds=xr.open_mfdataset(files)
print(ds)
但是,我似乎无法将我的列表解释为被读入源中的可变年份。
有什么想法吗?
谢谢。
编辑:
path = 'https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface'
files = ['{0}/air.sig995.{1:04d}.nc'.format(path, years) for years in range(1950,2005,1)]
print(files)
nc = netCDF4.MFDataset(files)
这是我正在使用的代码。当我尝试打开这些文件时,出现错误:
OSError: [Errno -90] NetCDF: file not found: b'https://www.esrl.noaa.gov/psd/thredds/catalog/Datasets/ncep.reanalysis/surface/air.sig995.1948.nc'
我输入的路径不正确吗?
答案 0 :(得分:0)
所有文件都命名为air.sig995.YYYY.nc
,因此您需要类似以下内容:
files = ['air.sig995.{0:04d}.nc'.format(years) for years in range(1950,2005,1)]
哪个会产生:
In [2]: files
Out[2]:
['air.sig995.1950.nc',
'air.sig995.1951.nc',
'air.sig995.1952.nc',
'air.sig995.1953.nc',
.....
您也可以在此处轻松添加(远程)路径(如果需要):
path = '/some/file/path'
files = ['{0}/air.sig995.{1:04d}.nc'.format(path, years) for years in range(1950,2005,1)]
有关Python中字符串格式的更多信息,请参见https://pyformat.info/。