在GeoDataFrame中查找非重叠多边形

时间:2017-11-24 11:02:07

标签: python shapely geopandas

我有一个带有一个shapely.polygons列的GeoDataFrame。其中一些是不同的,有些 - 不是:

In [1]: gdf
Out[2]:
    geometry
1   POLYGON ((1 1, 1 2, 2 2, 2 1, 1 1))
2   POLYGON ((1 3, 1 4, 2 4, 2 3, 1 3))
3   POLYGON ((1 1, 1 2, 2 2, 2 1, 1 1))
4   POLYGON ((3 1, 3 2, 4 2, 4 1, 3 1))
5   POLYGON ((1 3, 1 4, 2 4, 2 3, 1 3))

我只需找到不同的(非重叠)多边形:

In [1]: gdf_distinct
Out[2]:
    geometry
1   POLYGON ((1 1, 1 2, 2 2, 2 1, 1 1))
2   POLYGON ((1 3, 1 4, 2 4, 2 3, 1 3))
4   POLYGON ((3 1, 3 2, 4 2, 4 1, 3 1))

由于多边形不可用,我不能在Pandas中使用简单的方法:

In [1]: gdf_distinct = gdf['geometry'].unique()

TypeError: unhashable type: 'Polygon'

是否有任何简单有效的方法来获得仅具有不同多边形的新GeoDataFrame?

P.S:

我找到了一种方法,但它只适用于完全重复的多边形,而且我认为效率不高:

In [1]: m = []
        for index, row in gdf.iterrows():]
           if row['geometry'] not in m:
              m.append(row['geometry'])
        gdf_distinct = GeoDataFrame(geometry=m)

1 个答案:

答案 0 :(得分:0)

让我们从4个多边形的列表开始,其中三个与其他多边形重叠:

from shapely.geometry import Polygon
import geopandas

polygons = [
    Polygon([[1, 1], [1, 3], [3, 3], [3, 1], [1, 1]]),
    Polygon([[1, 3], [1, 5], [3, 5], [3, 3], [1, 3]]),
    Polygon([[2, 2], [2, 3.5], [3.5, 3.5], [3.5, 2], [2, 2]]),
    Polygon([[3, 1], [3, 2], [4, 2], [4, 1], [3, 1]]),
]
gdf = geopandas.GeoDataFrame(data={'A': list('ABCD')}, geometry=polygons)
gdf.plot(column='A', alpha=0.75)

他们看起来像这样:

enter image description here

因此,我们可以循环遍历每个,然后遍历所有其他人,并检查shapely API的重叠。如果没有任何重叠,我们会将其附加到输出列表中:

non_overlapping = []
for p in polygons:
    overlaps = []
    for g in filter(lambda g: not g.equals(p), polygons):
        overlaps.append(g.overlaps(p))

    if not any(overlaps):
        non_overlapping.append(p)

任何给我的东西:

['POLYGON ((3 1, 3 2, 4 2, 4 1, 3 1))']

这是我所期待的。

但这实际上是 O(N ^ 2),而我认为不一定是这样。

所以让我们试着永远不要两次检查同一对:

non_overlapping = []
for n, p in enumerate(polygons[:-1], 1):  # don't include the last element
    overlaps = []
    for g in polygons[n:]:  # loop from the next element to the end
        overlaps.append(g.overlaps(p))

    if not any(overlaps):
        non_overlapping.append(str(p))

我得到了相同的结果,我的机器上的速度更快。

我们可以使用if语句中的生成器而不是普通的for块来压缩循环:

non_overlapping = []
for n, p in enumerate(polygons[:-1], 1):
    if not any(p.overlaps(g) for g in polygons[n:]):
        non_overlapping.append(p)

同样的故事。