我有一个netCDF文件,其中包含名为var
2001-01-01到2010-12-31的变量的每日数据。我想计算var
的每月总和,从而产生包含12个时间步长的netCDF(一年中每个月一个)。目前,我这样做:
import xarray as xr
hndl_fl = xr.open_dataset(path_file)
hndl_fl.resample('1MS', dim='time', how='sum')
然而,这导致netCDF每月从2001年到2010年的每月总和。我如何获得12个月的月平均值?
答案 0 :(得分:5)
评论:我正在寻找12个月的月平均值(从2001年到2010年的所有年份)。您的解决方案仅计算1年的月平均值
我的第一次输出从 2001-01 开始直到 2010-12 ,所以所有年份都被覆盖。
您是否希望再次resample
这些 120 值?
如何获得12个月的月平均值?
你必须决定你想要什么:
一年中每个月的平均值,每年产生12个值,10年内最多120个值
或强>
平均为1年,10年内产生10个值
使用以下xarray.Dataset
,date_range = 10年
date_range('2001-01-01', '2010-12-31', name='time')
<xarray.Dataset>
Dimensions: (time: 3652)
Coordinates:
* time (time) datetime64[ns] 2001-01-01 2001-01-02 2001-01-03 ...
Data variables:
data (time) float64 16.0 18.0 15.0 12.0 23.0 9.0 7.0 18.0 23.0 23.0 ...
获取monthly_avr
中每个月的date_range('2001-01-01', '2010-12-31', name='time')
:
monthly_avr = ds.resample('1MS', dim='time', how='mean')
输出
monthly_avr=<xarray.Dataset>
Dimensions: (time: 120)
Coordinates:
* time (time) datetime64[ns] 2001-01-01 2001-02-01 2001-03-01 ...
Data variables:
data (time) float64 17.42 16.54 19.23 18.37 14.74 17.8 16.45 17.29 ...
获取year_avr
中每年的date_range('2001-01-01', '2010-12-31', name='time')
:
year_avr = ds.resample('1AS', dim='time', how='mean')
输出
year_avr=<xarray.Dataset>
Dimensions: (time: 10)
Coordinates:
* time (time) datetime64[ns] 2001-01-01 2002-01-01 2003-01-01 ...
Data variables:
data (time) float64 17.22 17.13 17.05 17.49 17.38 17.07 16.72 16.47 ...
使用Python测试:3.4.2 - xarray:0.9.1
答案 1 :(得分:1)
无论
hndl_fl.resample('1MS', dim='time', how='mean')
或
hndl_fl.groupby('time.month').mean('time')
应该做的伎俩,取决于你想要什么。