使用矢量shapefile

时间:2016-01-16 08:36:28

标签: python numpy matplotlib shapefile matplotlib-basemap

这是我的问题。

1。简介

  • 多边形类型的shapefile表示研究区域

http://i8.tietuku.com/08fdccbb7e11c0a9.png

  • 位于整个矩形地图中的某个点

http://i8.tietuku.com/877f87022bf817b8.png

我想测试每个点是否位于多边形内/外并进行进一步操作(例如,将研究区域内的网格点数量相加)

2。我的想法

由于有关堆栈溢出的信息,我有两种方法。

2.1想法A.

将shapefile栅格化为栅格文件,然后进行测试。

我还没有这样做,但我问过一个问题here并得到答案。

2.2想法B.

我尝试使用poly.contain()来测试散点的位置,但结果与现实不符。

3。我的代码基于创意B:

例如:

  • 原始数据由 pt (一个pandas Dataframe)表示,其中包含1000个网格X,Y。
  • shapefile我已经显示的是研究区域,我想过滤原始数据,只留下该区域内的点。
3.1准备
# map four boundaries
xc1,xc2,yc1,yc2 = 113.49805889531724,115.5030664238035,37.39995194888143,38.789235929357105
# grid definition
lon_grid  = np.linspace(x_map1,x_map2,38)
lat_grid  = np.linspace(y_map1,y_map2,32)
3.1准备
# generate (lon,lat)   
xx = lon_grid[pt.X.iloc[:].as_matrix()]
yy = lat_grid[pt.Y.iloc[:].as_matrix()]

sh = (len(xx),2)
data = np.zeros(len(xx)*2).reshape(*sh)
for i in range(0,len(xx),1):
    data[i] = np.array([xx[i],yy[i]])

# reading the shapefile

map = Basemap(llcrnrlon=x_map1,llcrnrlat=y_map1,urcrnrlon=x_map2,\
              urcrnrlat=y_map2)
map.readshapefile('/xx,'xx')
3.2测试
patches=[]
for info, shape in zip(map.xxx_info, map.xxx):
    x,y=zip(*shape)
    patches.append(Polygon(np.array(shape), True) )
for poly in patches:
     mask = np.array([poly.contains_point(xy) for xy in data])
  • 然后,我有一个numpy数组掩码,其值为0,1表示内/外。
  • 将面具合并到 pt ==> pt = pt [[pt.mask == 1]],我可以过滤点
  

但问题是使用poly,contains_point(xy),我无法将结果与我的尝试相匹配。

我的想法2 的一个例子

将值0,1加上

unique, counts = np.unique(mask, return_counts=True)      
print np.asarray((unique, counts)).T
#result:  
> [[0 7]  
  [1 3]]

http://i4.tietuku.com/7d156db62c564a30.png

从唯一值,shapefile区域内必须有3个点,但结果显示另外一个点。

40点的另一项测试

http://i4.tietuku.com/5fc12514265b5a50.png

4。我的问题

结果是错的,我还没想出来。
但我认为问题可能有两个原因:

  • 多边形shapefile错误(一个简单的多边形,我认为问题不在这里)。
  • 使用poly.contains_point(xy)不正确。

添加2016-01-16

感谢您的回答,我发现的原因是shapefile本身 当我将它改成shapely.polygon时,效果很好。

这是我的代码和结果

c =    fiona.open("xxx.shp")
pol = c.next()
geom = shape(pol['geometry'])
poly_data = pol["geometry"]["coordinates"][0]
poly = Polygon(poly_data)
ax.add_patch(plt.Polygon(poly_data))

xx = lon_grid[pt_select.X.iloc[:].as_matrix()]
yy = lat_grid[pt_select.Y.iloc[:].as_matrix()]

sh = (len(xx),2)
points = np.zeros(len(xx)*2).reshape(*sh)
for i in range(0,len(xx),1):
    points[i] = np.array([xx[i],yy[i]])
mask = np.array([poly.contains(Point(x, y)) for x, y in points])

ax.plot(points[:, 0], points[:, 1], "rx")
ax.plot(points[mask, 0], points[mask, 1], "ro")    

http://i4.tietuku.com/8d895efd3d9d29ff.png

1 个答案:

答案 0 :(得分:4)

你可以使用塑造:

import numpy as np
from shapely.geometry import Polygon, Point

poly_data = [[0, 0], [0, 1], [1, 0], [0.2, 0.5]]
poly = Polygon(poly_data)

points = np.random.rand(100, 2)

mask = np.array([poly.contains(Point(x, y)) for x, y in points])

这是情节代码:

将pylab导入为pl

fig, ax = pl.subplots()
ax.add_patch(pl.Polygon(poly_data))
ax.plot(points[:, 0], points[:, 1], "rx")
ax.plot(points[mask, 0], points[mask, 1], "ro")

输出:

enter image description here

您还可以使用MultiPoint加速计算:

from shapely.geometry import Polygon, MultiPoint

poly_data = [[0, 0], [0, 1], [1, 0], [0.2, 0.5]]
poly = Polygon(poly_data)
points = np.random.rand(100, 2)
inside_points = np.array(MultiPoint(points).intersection(poly))

你也可以在matplotlib中使用Polygon.contains_point()

poly = pl.Polygon(poly_data)
mask = [poly.contains_point(p) for p in points]