我有两组带有多边形的shapefile。一套shapefile只是我感兴趣的美国县,而且不同公司和年份都有所不同。另一组shapefile是公司的业务领域,当然这会因公司和年份而异。我需要在每年为每个公司获得这两个层的交集。到目前为止,函数叠加(df1,df2,how ='intersection')完成了我的目标。但每个公司年需要大约300秒。鉴于我有很多公司和很多年,我需要几天才能完成。有没有办法提高这种性能?
我注意到如果我在ArcGIS中做同样的事情,那么300秒就会缩短几秒钟。但我是ArcGIS的新用户,还不熟悉它中的python。
答案 0 :(得分:3)
如果您查看当前的geopandas覆盖源代码,他们实际上已经更新了覆盖功能以利用Rtree空间索引!我不认为此时手动进行Rtree会更快(实际上可能会更慢)。
在此处查看源代码:https://github.com/geopandas/geopandas/blob/master/geopandas/tools/overlay.py
答案 1 :(得分:0)
希望您现在已经明白这一点,但解决方案是利用Geopanda的R-tree空间索引。通过适当实施,您可以实现数量级的改进。
Goeff Boeing写了excellent tutorial。