我有一个包含芝加哥地址的数据框,将其地理编码为纬度和经度值,然后编码为Point对象(使该DataFrame成为GeoDataFrame)。一小部分错误地使用了芝加哥以外的LatLong值进行了地理编码。我有一个芝加哥边界(GeoDataFrame)的shapefile,我想选择点在芝加哥边界多边形之外的所有行。
选择多边形内的所有点很容易(通过geopandas sjoin函数),但是我还没有找到一种选择不在多边形内的点的好方法。是否存在?
答案 0 :(得分:1)
如果将芝加哥边界GeoDataFrame转换为单个多边形,例如:
chicago = df_chicago.geometry.unary_union
然后,您可以将布尔过滤与within
运算符一起使用,以选择芝加哥内外的点:
within_chicago = df[df.geometry.within(chicago)]
outside_chicago = df[~df.geometry.within(chicago)]
使用~
反转布尔条件。
或者,您可以使用disjoint
空间谓词:
outside_chicago = df[df.geometry.disjoint(chicago)]