散景 - 使用数据共享器绘制shapefile地图

时间:2017-09-25 10:17:53

标签: python-2.7 bokeh datashader

最初,我创建了一个英国邮政编码区域的交互式地图,其中单个区域根据其值(例如,该邮政编码区域中的人口)进行颜色表示,如下所示。

from bokeh.plotting import figure
from bokeh.palettes import Viridis256 as palette
from bokeh.models import LinearColorMapper
from bokeh.models import ColumnDataSource
import geopandas as gpd

shp = 'file_path_to_the_downloaded_shapefile'
#read shape file into dataframe using geopandas
df = gpd.read_file(shp)

def expandMultiPolygons(row, geometry):
    if row[geometry].type = 'MultiPolygon':
       row[geometry] = [p for p in row[geometry]]
    return row
#Some rows were in MultiPolygons instead of Polygons.
#Expand MultiPolygons to multi rows of Polygons
df = df.apply(expandMultiPolygons, geometry='geometry', axis=1)
df = df.set_index('Area')['geometry'].apply(pd.Series).stack().reset_index()

#Visualize the polygons. To visualize different colors for different post areas, I added another column called 'value' which has some random integer value. 

p = figure()
color_mapper = LinearColorMapper(palette=palette)
source = ColumnDataSource(df)
p.patches('x', 'y', source=source,\
            fill_color={'field': 'value', 'transform': color_mapper},\
            fill_alpha=1.0, line_color="black", line_width=0.05)

其中df是四列的数据帧:邮政编码区域,x坐标,y坐标,值(即人口)。

上面的代码在Web浏览器上创建了一个很好的交互式地图,但是我注意到交互性在速度上并不是很平滑。如果我放大或移动地图,它会慢慢渲染。数据帧的大小只有1106行,所以我很困惑为什么它这么慢。

作为可能的解决方案之一,我遇到了数据共享器(https://datashader.readthedocs.io/en/latest/),但我发现示例脚本非常复杂,其中大多数都是在Jupyter笔记本上使用holoview包但我想创建一个仪表板使用背景虚化。

有没有人建议我将数据分析器合并到上面的散景脚本中?我是否需要在数据分析器中使用不同的功能来创建形状贴图而不是使用散景贴片功能?

任何建议都将受到高度赞赏!!!

3 个答案:

答案 0 :(得分:5)

如果没有涉及数据文件,我无法直接回答您的问题,但可以提供一些观察结果:

  1. Datashader不太可能用于此目的,因为数据共享器目前不支持渲染多边形。根据经验,Datashader旨在聚合您的数据,如果已经汇总,Datashader通常不会提供帮助。在这里,您的数据是通过邮政编码聚合的,数据共享者无法处理,但如果您拥有每人的原始数据,那么很乐意进行渲染。
  2. 如果您更喜欢直接使用Bokeh而不是通过更高级别的HoloViews / GeoViews界面,我建议您在accelerating geopandas上完成Matt Rocklin的工作。他的方法应该非常快,以达到你的目的。
  3. 所有这一切,HoloViewsGeoViews应该是一般使用Bokeh的便捷方式,无论您是否想要创建仪表板。例如。 2017 JupyterCon tutorial显示如何使用两个库制作一个简单的Bokeh仪表板。它不包括形状文件,但other GeoViews examples涵盖了这些文件。

答案 1 :(得分:0)

正如我的评论中提到的,我相信您的多边形的复杂性可能会导致您的问题。您链接的文件包含几个不同大小和复杂程度的shapefile。您可以简化这些,即减少每个多边形的点数。这可以改变它们的外观。它可以从几乎没有区别,更多的“边缘”到角度外观。这取决于您选择的简化程度。根据您的需要,您可以选择不同级别的简单性。

我知道有三个简单的方法可以完成这项工作:

  1. GUI:尝试QGis。它是地理空间数据处理的一个很好的开源工具。将Shapefile加载为新图层。然后使用Vector菜单下的“Simplify Geometries”工具。
  2. 命令行:GDAL是一个开源库。它附带了一个有用的命令行工具。您可以像这样使用它:ogr2ogr outfile.shp infile.shp -simplify 0.000001
  3. 在线:访问mapshader。导入您的文件。选择简化并选择您的级别。然后,导出结果。我真正喜欢的是你的文件立即呈现。因此,您可以立即看到简化的结果。
  4. 除此之外,您还应该更新散景版本。它定期更新,自那以后有一些性能改进。

    使用HoloViews或GeoViews不会对您的表现产生积极影响。因此,它与您的问题无关。我猜@James A. Bednar只是在那里提出一些建议。

答案 2 :(得分:0)

当我移动滑块时,我找到了加快英国地图交互式可视化的方法。

我首先为不同的滑块值创建了单独的图像(2D),并使用2D图像而不是使用散景补丁功能更新了地图。

由于图像采用数组格式,因此在更改滑块中的值时更新图像要快得多。这种方法的一个缺点是我不能再在英国地图上使用悬停功能。

我引用了以下url将多边形信息转换为数组:https://gist.github.com/brendancol/db030013e981c46acb2886060dde607e#file-rasterio_datashader_polygons-py-L35