与x和y meshgrid值匹配的z值的网格

时间:2015-11-20 11:24:31

标签: python arrays numpy

编辑:原始问题存在缺陷,但出于透明原因,我将其留在此处。

原始 我有一些x,y,z数据,其中x和y是2D网格的坐标,z是对应于(x,y)的标量值。

>>> import numpy as np
>>> # Dummy example data 
>>> x = np.arange(0.0, 5.0, 0.5)
>>> y = np.arange(1.0, 2.0, 0.1)
>>> z = np.sin(x)**2 + np.cos(y)**2
>>> print "x = ", x, "\n", "y = ", y, "\n", "z = ", z
x =  [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5] 
y =  [ 1.   1.1  1.2  1.3  1.4  1.5  1.6  1.7  1.8  1.9] 
z =  [ 0.29192658  0.43559829  0.83937656  1.06655187  0.85571064  0.36317266
  0.02076747  0.13964978  0.62437081  1.06008127]

使用xx, yy = np.meshgrid(x, y)我可以得到两个包含与每个网格位置对应的x和y值的网格。

>>> xx, yy = np.meshgrid(x, y)
>>> print xx
[[ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]
 [ 0.   0.5  1.   1.5  2.   2.5  3.   3.5  4.   4.5]]
>>> print yy
[[ 1.   1.   1.   1.   1.   1.   1.   1.   1.   1. ]
 [ 1.1  1.1  1.1  1.1  1.1  1.1  1.1  1.1  1.1  1.1]
 [ 1.2  1.2  1.2  1.2  1.2  1.2  1.2  1.2  1.2  1.2]
 [ 1.3  1.3  1.3  1.3  1.3  1.3  1.3  1.3  1.3  1.3]
 [ 1.4  1.4  1.4  1.4  1.4  1.4  1.4  1.4  1.4  1.4]
 [ 1.5  1.5  1.5  1.5  1.5  1.5  1.5  1.5  1.5  1.5]
 [ 1.6  1.6  1.6  1.6  1.6  1.6  1.6  1.6  1.6  1.6]
 [ 1.7  1.7  1.7  1.7  1.7  1.7  1.7  1.7  1.7  1.7]
 [ 1.8  1.8  1.8  1.8  1.8  1.8  1.8  1.8  1.8  1.8]
 [ 1.9  1.9  1.9  1.9  1.9  1.9  1.9  1.9  1.9  1.9]]

现在我想要一个z的相同形状的数组,其中网格值对应于原始数据中匹配的x和y值!但是我找不到一个优雅的内置解决方案,我不需要对数据进行重新网格化,而且我认为我对如何处理数据缺乏了解。

我尝试过this解决方案(使用我的真实数据,而不是这个简单的示例数据,但它应该有相同的结果)但我的最终网格没有完全填充。 请帮忙!

更正的问题:

正如评论者所指出的那样,我原来的假数据不适合我提出的问题。以下是该问题的改进版本:

我有一些x,y,z数据,其中x和y是2D网格的坐标,z是对应于(x,y)的标量值。数据从文本文件" data.txt":

中读取
#x y z
1.4 0.2 1.93164166734
1.4 0.3 1.88377897779
1.4 0.4 1.81946452501
1.6 0.2 1.9596778849
1.6 0.3 1.91181519535
1.6 0.4 1.84750074257
1.8 0.2 1.90890970517
1.8 0.3 1.86104701562
1.8 0.4 1.79673256284
2.0 0.2 1.78735230743
2.0 0.3 1.73948961789
2.0 0.4 1.67517516511

加载文字:

>>> import numpy as np
>>> inFile = 'C:\data.txt' 
>>> x, y, z = np.loadtxt(inFile, unpack=True, usecols=(0, 1, 2), comments='#', dtype=float)
>>> print x
[ 1.4  1.4  1.4  1.6  1.6  1.6  1.8  1.8  1.8  2.   2.   2. ]
>>> print y
[ 0.2  0.3  0.4  0.2  0.3  0.4  0.2  0.3  0.4  0.2  0.3  0.4]
>>> print z
[ 1.93164167  1.88377898  1.81946453  1.95967788  1.9118152   1.84750074
  1.90890971  1.86104702  1.79673256  1.78735231  1.73948962  1.67517517]

使用xx, yy= np.meshgrid(np.unique(x), np.unique(y))我可以得到两个包含与每个网格位置对应的x和y值的网格。

>>> xx, yy= np.meshgrid(np.unique(x), np.unique(y))
>>> print xx
 [[ 1.4  1.6  1.8  2. ]
 [ 1.4  1.6  1.8  2. ]
 [ 1.4  1.6  1.8  2. ]]
>>> print yy
[[ 0.2  0.2  0.2  0.2]
 [ 0.3  0.3  0.3  0.3]
 [ 0.4  0.4  0.4  0.4]]

现在,xx和yy中的每个对应单元格位置对应于原始网格点位置之一。 我只需要一个等效数组,其中网格值对应于原始数据中匹配的z值!

"""e.g. 
[[ 1.93164166734  1.9596778849  1.90890970517  1.78735230743]
 [ 1.88377897779  1.91181519535  1.86104701562  1.73948961789]
 [ 1.81946452501  1.84750074257  1.79673256284  1.67517516511]]"""

但是我找不到一个优雅的内置解决方案,我不需要对数据进行重新网格化,我想我对如何处理数据缺乏了解。例如,使用xx, yy, zz = np.meshgrid(x, y, z)会返回三个我认为无法使用的3D数组。

请帮忙!

修改 由于Jaime的解决方案Fill 2D numpy array from three 1D numpy arrays

,我设法让这个例子成功
>>> x_vals, x_idx = np.unique(x, return_inverse=True)
>>> y_vals, y_idx = np.unique(y, return_inverse=True)
>>> vals_array = np.empty(x_vals.shape + y_vals.shape)
>>> vals_array.fill(np.nan) # or whatever your desired missing data flag is
>>> vals_array[x_idx, y_idx] = z
>>> zz = vals_array.T
>>> print zz

但是导致我走上这条道路的代码(带有真实的输入数据)仍然失败了。我现在发现了这个问题。在生成zz之前,我一直使用scipy.ndimage.zoom将网格数据重新采样为更高分辨率

>>> import scipy.ndimage
>>> zoom = 2
>>> x =  scipy.ndimage.zoom(x, zoom)
>>> y =  scipy.ndimage.zoom(y, zoom)
>>> z =  scipy.ndimage.zoom(z, zoom)

这产生了一个包含许多nan条目的数组:

array([[ nan,  nan,  nan, ...,  nan,  nan,  nan],
       [ nan,  nan,  nan, ...,  nan,  nan,  nan],
       [ nan,  nan,  nan, ...,  nan,  nan,  nan],
       ..., 
       [ nan,  nan,  nan, ...,  nan,  nan,  nan],
       [ nan,  nan,  nan, ...,  nan,  nan,  nan],
       [ nan,  nan,  nan, ...,  nan,  nan,  nan]])

当我跳过缩放阶段时,会产生正确的数组:

array([[-22365.93400183, -22092.31794674, -22074.21420168, ...,
        -14513.89091599, -12311.97437017, -12088.07062786],
       [-29264.34039242, -28775.79743097, -29021.31886353, ...,
        -21354.6799064 , -21150.76555669, -21046.41225097],
       [-39792.93758344, -39253.50249278, -38859.2562673 , ...,
        -24253.36838785, -25714.71895023, -29237.74277727],
       ..., 
       [ 44829.24733543,  44779.37084337,  44770.32987311, ...,
         21041.42652441,  20777.00408692,  20512.58162671],
       [ 44067.26616067,  44054.5398901 ,  44007.62587598, ...,
         21415.90416488,  21151.48168444,  20887.05918082],
       [ 43265.35371973,  43332.5983711 ,  43332.21743471, ...,
         21780.32283309,  21529.39770759,  21278.47255848]])

0 个答案:

没有答案