我有一个带有一个shapely.polygons列的GeoDataFrame。其中一些是不同的,有些 - 不是:
In [1]: gdf
Out[2]:
geometry
1 POLYGON ((1 1, 1 2, 2 2, 2 1, 1 1))
2 POLYGON ((1 3, 1 4, 2 4, 2 3, 1 3))
3 POLYGON ((1 1, 1 2, 2 2, 2 1, 1 1))
4 POLYGON ((3 1, 3 2, 4 2, 4 1, 3 1))
5 POLYGON ((1 3, 1 4, 2 4, 2 3, 1 3))
我只需找到不同的(非重叠)多边形:
In [1]: gdf_distinct
Out[2]:
geometry
1 POLYGON ((1 1, 1 2, 2 2, 2 1, 1 1))
2 POLYGON ((1 3, 1 4, 2 4, 2 3, 1 3))
4 POLYGON ((3 1, 3 2, 4 2, 4 1, 3 1))
由于多边形不可用,我不能在Pandas中使用简单的方法:
In [1]: gdf_distinct = gdf['geometry'].unique()
TypeError: unhashable type: 'Polygon'
是否有任何简单有效的方法来获得仅具有不同多边形的新GeoDataFrame?
P.S:
我找到了一种方法,但它只适用于完全重复的多边形,而且我认为效率不高:
In [1]: m = []
for index, row in gdf.iterrows():]
if row['geometry'] not in m:
m.append(row['geometry'])
gdf_distinct = GeoDataFrame(geometry=m)
答案 0 :(得分:0)
让我们从4个多边形的列表开始,其中三个与其他多边形重叠:
from shapely.geometry import Polygon
import geopandas
polygons = [
Polygon([[1, 1], [1, 3], [3, 3], [3, 1], [1, 1]]),
Polygon([[1, 3], [1, 5], [3, 5], [3, 3], [1, 3]]),
Polygon([[2, 2], [2, 3.5], [3.5, 3.5], [3.5, 2], [2, 2]]),
Polygon([[3, 1], [3, 2], [4, 2], [4, 1], [3, 1]]),
]
gdf = geopandas.GeoDataFrame(data={'A': list('ABCD')}, geometry=polygons)
gdf.plot(column='A', alpha=0.75)
他们看起来像这样:
因此,我们可以循环遍历每个,然后遍历所有其他人,并检查shapely
API的重叠。如果没有任何重叠,我们会将其附加到输出列表中:
non_overlapping = []
for p in polygons:
overlaps = []
for g in filter(lambda g: not g.equals(p), polygons):
overlaps.append(g.overlaps(p))
if not any(overlaps):
non_overlapping.append(p)
任何给我的东西:
['POLYGON ((3 1, 3 2, 4 2, 4 1, 3 1))']
这是我所期待的。
但这实际上是 O(N ^ 2),而我认为不一定是这样。
所以让我们试着永远不要两次检查同一对:
non_overlapping = []
for n, p in enumerate(polygons[:-1], 1): # don't include the last element
overlaps = []
for g in polygons[n:]: # loop from the next element to the end
overlaps.append(g.overlaps(p))
if not any(overlaps):
non_overlapping.append(str(p))
我得到了相同的结果,我的机器上的速度更快。
我们可以使用if
语句中的生成器而不是普通的for
块来压缩循环:
non_overlapping = []
for n, p in enumerate(polygons[:-1], 1):
if not any(p.overlaps(g) for g in polygons[n:]):
non_overlapping.append(p)
同样的故事。