我正在尝试为xarray数据集中的时间维度的子集计算每月气候。时间是使用datetime64定义的。
如果我想使用整个时间序列,这会很好:
monthly_avr=ds_clm.groupby('time.month').mean(dim='time')
但是我真的只想要比2001年长的年份。这两项工作均不可行:
monthly_avr2=ds_clm.where(ds_clm.time>'2001-01-01').groupby('time.month').mean('time')
monthly_avr3=ds_clm.isel(time=slice('2001-01-01', '2018-01-01')).groupby('time.month').mean('time')
这是我的数据集的样子:
<xarray.Dataset>
Dimensions: (hist_interval: 2, lat: 192, lon: 288, time: 1980)
Coordinates:
* lon (lon) float32 0.0 1.25 2.5 3.75 5.0 6.25 7.5 8.75 10.0 ...
* lat (lat) float32 -90.0 -89.057594 -88.11518 -87.172775 ...
* time (time) datetime64[ns] 1850-01-31 1850-02-28 1850-03-31 ...
Dimensions without coordinates: hist_interval
Data variables:
EFLX_LH_TOT (time, lat, lon) float32 0.26219246 0.26219246 0.26219246 ...
有人知道使用datetime64进行时间子集设置的正确语法吗?
答案 0 :(得分:2)
通常使用sel()
方法按坐标值索引和选择xarray中的数据。在您的情况下,类似以下示例的方法应该起作用。
monthly_avr3 = ds_clm.sel(
time=slice('2001-01-01', '2018-01-01')).groupby('time.month').mean('time')
使用where()
方法有时也很有用,但是对于您的用例,您还需要添加drop=True
选项:
monthly_avr2 = ds_clm.where(
ds_clm['time.year'] > 2000, drop=True).groupby('time.month').mean('time')