我需要帮助阅读多个netCDF文件,尽管这里没有几个例子,但它们都没有正常工作。 我正在使用Python(x,y)vers 2.7.5和其他软件包:netcdf4 1.0.7-4,matplotlib 1.3.1-4,numpy 1.8,pandas 0.12, 底图1.0.2 ......
我很少习惯用GrADS做的事情,我需要在Python中开始做它们。 我有一些2米温度数据(每年4小时数据,来自ECMWF),每个文件包含2米临时数据,Xsize = 480,Ysize = 241, 对于闰年,Zsize(水平)= 1,Tsize(时间)= 1460或1464。 这些是我的文件名相似:t2m.1981.nc,t2m.1982.nc,t2m.1983.nc ......等。
基于此页面: (Loop through netcdf files and run calculations - Python or R) 我现在就在这里:
from pylab import *
import netCDF4 as nc
from netCDF4 import *
import matplotlib.pyplot as plt
from mpl_toolkits.basemap import Basemap
import numpy as np
f = nc.MFDataset('d:/data/ecmwf/t2m.????.nc') # as '????' being the years
t2mtr = f.variables['t2m']
ntimes, ny, nx = shape(t2mtr)
temp2m = zeros((ny,nx),dtype=float64)
print ntimes
for i in xrange(ntimes):
temp2m += t2mtr[i,:,:] #I'm not sure how to slice this, just wanted to get the 00Z values.
# is it possible to assign to a new array,...
#... (for eg.) the average values of 00z for January only from 1981-2000?
#creating a NetCDF file
nco = nc.Dataset('d:/data/ecmwf/t2m.00zJan.nc','w',clobber=True)
nco.createDimension('x',nx)
nco.createDimension('y',ny)
temp2m_v = nco.createVariable('t2m', 'i4', ( 'y', 'x'))
temp2m_v.units='Kelvin'
temp2m_v.long_name='2 meter Temperature'
temp2m_v.grid_mapping = 'Lambert_Conformal' # can it be something else or ..
#... eliminated?).This is straight from the solution on that webpage.
lono = nco.createVariable('longitude','f8')
lato = nco.createVariable('latitude','f8')
xo = nco.createVariable('x','f4',('x')) #not sure if this is important
yo = nco.createVariable('y','f4',('y')) #not sure if this is important
lco = nco.createVariable('Lambert_Conformal','i4') #not sure
#copy all the variable attributes from original file
for var in ['longitude','latitude']:
for att in f.variables[var].ncattrs():
setattr(nco.variables[var],att,getattr(f.variables[var],att))
# copy variable data for lon,lat,x and y
lono=f.variables['longitude'][:]
lato=f.variables['latitude'][:]
#xo[:]=f.variables['x']
#yo[:]=f.variables['y']
# write the temp at 2 m data
temp2m_v[:,:]=temp2m
# copy Global attributes from original file
for att in f.ncattrs():
setattr(nco,att,getattr(f,att))
nco.Conventions='CF-1.6' #not sure what is this.
nco.close()
#attempt to plot the 00zJan mean
file=nc.Dataset('d:/data/ecmwf/t2m.00zJan.nc','r')
t2mtr=file.variables['t2m'][:]
lon=file.variables['longitude'][:]
lat=file.variables['latitude'][:]
clevs=np.arange(0,500.,10.)
map = Basemap(projection='cyl',llcrnrlat=0.,urcrnrlat=10.,llcrnrlon=97.,urcrnrlon=110.,resolution='i')
x,y=map(*np.meshgrid(lon,lat))
cs = map.contourf(x,y,t2mtr,clevs,extend='both')
map.drawcoastlines()
map.drawcountries()
plt.plot(cs)
plt.show()
第一个问题是temp2m += t2mtr[1,:,:]
。我不确定如何将数据切片以仅获得所有文件的00z(仅限1月)。
第二,在运行测试时,cs = map.contourf(x,y,t2mtr,clevs,extend='both')
出现错误,称“形状与z:found(1,1)而不是(241,480)”的形状不匹配。我知道输出数据可能有一些错误,因为记录值时出错,但我无法弄清楚是什么/在哪里。
感谢您的时间。我希望这不会令人困惑。
答案 0 :(得分:3)
所以t2mtr
是一个3d数组
ntimes, ny, nx = shape(t2mtr)
这是第1轴上所有值的总和:
for i in xrange(ntimes):
temp2m += t2mtr[i,:,:]
更好的方法是:
temp2m = np.sum(tm2tr, axis=0)
temp2m = tm2tr.sum(axis=0) # alt
如果您想要平均值,请使用np.mean
代替np.sum
。
要在时间子集jan_times
中进行平均,请使用如下表达式:
jan_avg = np.mean(tm2tr[jan_times,:,:], axis=0)
如果您只想要一个简单的范围,例如前30次,这是最简单的。为简单起见,我假设数据是每日,而年份是恒定长度。你可以调整4小时频率和闰年的东西。
tm2tr[0:31,:,:]
获取Jan数据多年的简单方法是构建一个索引,如:
yr_starts = np.arange(0,3)*365 # can adjust for leap years
jan_times = (yr_starts[:,None]+ np.arange(31)).flatten()
# array([ 0, 1, 2, ... 29, 30, 365, ..., 756, 757, 758, 759, 760])
另一个选择是重塑tm2tr
(闰年效果不佳)。
tm2tr.reshape(nyrs, 365, nx, ny)[:,0:31,:,:].mean(axis=1)
您可以使用以下内容测试时间采样:
np.arange(5*365).reshape(5,365)[:,0:31].mean(axis=1)
数据集是否有时间变量?您可以从中提取所需的时间索引。我在几年前使用ECMWF数据,但不记得很多细节。
至于您的contourf
错误,我会检查3个主要参数的形状:x
,y
,t2mtr
。他们应该匹配。我没有使用Basemap
。