我对这个话题很难,尽管它看起来应该很简单。
我想使用一组纬度和经度坐标切片xarray数据集。
以下是我的数据集:
In [31]: data = xr.open_mfdataset(open_file, decode_cf=True)
In [32]: data
Out[32]:
<xarray.Dataset>
Dimensions: (time: 108120, x: 349, y: 277)
Coordinates:
lons (y, x) float64 -145.5 -145.3 -145.1 -144.9 -144.8 -144.6 -144.4 ...
lats (y, x) float64 1.0 1.104 1.208 1.312 1.416 1.519 1.621 1.724 ...
* time (time) datetime64[ns] 1980-01-01 1980-01-01T03:00:00 ...
Dimensions without coordinates: x, y
Data variables:
stp (time, y, x) float64 0.1235 0.0867 0.07183 0.05389 0.05901 ...
以下是我要做的事情:
In [48]: lat_bnd = [25,30]
...: lon_bnd = [-80,-75]
In [49]: r = data.sel(y=slice(*lat_bnd),x=slice(*lon_bnd))
一切看起来都很棒:
In [50]: r
Out[50]:
<xarray.Dataset>
Dimensions: (time: 108120, x: 5, y: 5)
Coordinates:
lons (y, x) float64 -82.52 -82.28 -82.05 -81.81 -81.57 -82.44 -82.2 ...
lats (y, x) float64 13.54 13.46 13.38 13.3 13.22 13.77 13.69 13.61 ...
* time (time) datetime64[ns] 1980-01-01 1980-01-01T03:00:00 ...
Dimensions without coordinates: x, y
Data variables:
stp (time, y, x) float64 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 ...
但我的纬度/经度值不正确:
In [53]: r.lats.values
Out[53]:
array([[ 13.53542397, 13.45647916, 13.37686013, 13.296571 ,
13.21561592],
[ 13.76719053, 13.6878189 , 13.60776989, 13.52704767,
13.44565641],
[ 13.99938176, 13.91958109, 13.83909988, 13.75794233,
13.67611265],
[ 14.2319952 , 14.15176326, 14.07084762, 13.98925249,
13.90698214],
[ 14.46502833, 14.3843629 , 14.30301059, 14.22097564,
14.13826236]])
In [54]: r.lons.values
Out[54]:
array([[-82.52229969, -82.28438922, -82.0469968 , -81.8101255 ,
-81.57377834],
[-82.44118948, -82.20260881, -81.96455096, -81.72701901, -81.490016 ],
[-82.3595596 , -82.12030558, -81.8815792 , -81.64338357,
-81.40572174],
[-82.27740522, -82.03747469, -81.79807668, -81.55921433,
-81.32089068],
[-82.19472148, -81.95411126, -81.71403851, -81.47450637, -81.2355179 ]])
当然,如果我尝试使用lats / lons坐标进行切片,我会收到错误,因为尺寸不匹配。
In [55]: r = data.sel(lats=slice(*lat_bnd),lons=slice(*lon_bnd))
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-55-7c6237be5f22> in <module>()
----> 1 r = data.sel(lats=slice(*lat_bnd),lons=slice(*lon_bnd))
/lib/anaconda2/lib/python2.7/site-packages/xarray/core/dataset.pyc in sel(self, method, tolerance, drop, **indexers)
1204 """
1205 pos_indexers, new_indexes = indexing.remap_label_indexers(
-> 1206 self, indexers, method=method, tolerance=tolerance
1207 )
1208 result = self.isel(drop=drop, **pos_indexers)
/lib/anaconda2/lib/python2.7/site-packages/xarray/core/indexing.pyc in remap_label_indexers(data_obj, indexers, method, tolerance)
275 new_indexes = {}
276
--> 277 dim_indexers = get_dim_indexers(data_obj, indexers)
278 for dim, label in iteritems(dim_indexers):
279 try:
/lib/anaconda2/lib/python2.7/site-packages/xarray/core/indexing.pyc in get_dim_indexers(data_obj, indexers)
243 if invalid:
244 raise ValueError("dimensions or multi-index levels %r do not exist"
--> 245 % invalid)
246
247 level_indexers = defaultdict(dict)
ValueError: dimensions or multi-index levels ['lons', 'lats'] do not exist
在我的理解中是否有一些我缺少的东西,这是一个NARR数据集?
答案 0 :(得分:2)
在第一个示例中,您不是按纬度/经度编制索引,而是按每个focusNextField (currentField, pinCode) {
const mapping = {
'1': {
variable: 'pC1',
next: '2'
},
'2': {
variable: 'pC2',
prev: '1',
next: '3'
},
'3': {
variable: 'pC3',
prev: '2'
},
};
this.state[mapping[currentField].variable] = pinCode || '';
if (pinCode) {
if (mapping[currentField].next) {
this.refs[mapping[currentField].next].focus();
}
} else {
if (mapping[currentField].prev) {
this.refs[mapping[currentField].prev].focus();
}
}
this.forceUpdate();
}
和x
的数字索引编制索引。也就是说,您正在切换第25个和第30个y
以及-80和-75th y
之间的值。这解释了为什么lat / lon值在输出中没有意义。
您可以使用xr.Dataset.set_index()
将您的坐标与尺寸相关联:
x
答案 1 :(得分:0)
一种解决方法可能是根据x,y坐标本身进行切片。要检查是否满足您的域要求,您可以查看快速绘图并调整x,y值以进行相应切片。但是,更好的方法是将您的经度转换为x,y坐标,然后根据相应的x,y进行切片。
答案 2 :(得分:0)
也许有人可能会感兴趣 - 通过使用您无法从 xarray 的最近邻域插值的良好特征中获利的地方。 我有一个类似的问题 - 一个曲线网格,二维数组作为 lons/lats 坐标。此外,我正在寻找最接近给定点的坐标。我使用以下附加函数将“任何”经纬度对转换为 (x,y) 元组:
def find_nearest(lons, lats, lon0,lat0):
idx = ((lons - lon0)**2+(lats - lat0)**2).argmin()
value_lat = lats.flat[idx]
return tuple(np.squeeze(np.where(lats2d == value_lat)))
然后,将其用作:
find_nearest(tmp.longitude.values,tmp.latitude.values, -22.16,32.3)