我正在尝试在美国的邮政编码范围内绘制值的彩色映射。我有一个json文件,其中包含对应于每个邮政编码的ZCTA5CE区域的要点。我正在使用Folium软件包。
目前,映射工作正常,但非常缓慢-基于json文件的大小(基于我的计算机上运行的其他项目,只有10分钟的时间,并且几乎无法通过滑动和缩放与地图进行交互) 482.2M),从而得出结果。
我要绘制的数据没有所有邮政编码的信息,因此我想删除与不是< / strong>。
我的问题是:如何遍历邮政编码信息字典并删除不在我指定的邮政编码列表中的字典。
要更清楚地了解我正在使用的字典的结构:
zip_code_geo_dict.keys()
给出:
dict_keys(['type', 'features'])
其中zip_code_geo_dict['type']
是字符串,而zip_code_geo_dict['features']
是列表。
现在,zip_code_geo_dict['features'][0]
是:
{'type': 'Feature','geometry': {'type': 'MultiPolygon',
'coordinates': [[[[-88.252618, 32.92675],
[-88.249724, 32.93242],
**bajillions of lines of coordinates here**
[-88.34043199999999, 32.991199]]]]},
'properties': {'ZCTA5CE10': '35442',
'AFFGEOID10': '8600000US35442',
'GEOID10': '35442',
'ALAND10': 610213891,
'AWATER10': 10838694}}
我的源数据可以更改,因此我要映射的邮政编码的实际列表是动态的。也就是说,我可以随时创建一个列表:
zips_of_interest = ['15210', '15222']
如何遍历zip_code_geo_dict
以删除基于zip_code_geo_dict['features']['properties']['ZCTA5CE10'] NOT IN zips_of_interest
的坐标信息?必须保持总体dict结构,以使过滤后的版本zip_code_geo_dict['features']
与原始版本位于同一“位置”(它必须是dict,是较大的{{1}中的第二个键) }对象)。
我认为有必要指出,我想保留字典的基本结构,因为我要将其传递给Folium中的zip_code_geo_dict
方法。
答案 0 :(得分:1)
如果邮政编码信息可能会更改,我的第一个建议是使用RTree,KDTree或BallTree之类的信息将信息存储在结构中,以便按区域轻松访问。有了这些功能,您就可以高效地进行查询,例如“在我感兴趣的邮政编码的r
半径内,所有邮政编码是什么?”。
就实际实现过滤器而言,如果您有很多邮政编码,则可能需要执行lookup = set(zips_of_interest)
之类的操作,以便可以搜索包含在O(1)中而不是O(n )。对于len(zips_of_interest)<15
左右,列表可能很好(取决于您的平台)。
您提到zip_code_geo_dict
的“第一项”是[某某某]。 zip_code_geo_dict
是什么类型?这是命令吗?从其中过滤掉内容取决于其确切含义。也就是说,对于常见的数据结构,您基本上已经编写了命令。
lookup = set(zip_code_geo_dict)
词典
condensed_data = {k:zip_code_geo_dict[k] for k in zip_code_geo_dict
if zip_code_geo_dict[k]['properties']['ZCTA5CE10'] in lookup}
列表
condensed_data = [v for v in zip_code_geo_dict
if v['properties']['ZCTA5CE10'] in lookup]
在这两种情况下,您基本上都是在告诉Python从原始数据结构中获取感兴趣的所有内容。
答案 1 :(得分:1)
不确定这是否是您要的内容。您发布的字典没有功能键。我编造了一个额外的字典,您建议的逻辑将不会删除它,并将这两个字典都放在列表中以提供完整的演示。
def filter_zips(geo_list, zip_list):
result = geo_list.copy()
for i, zip_code_geo_dict in enumerate(result):
if zip_code_geo_dict['properties']['ZCTA5CE10'] not in zip_list:
del result[i]
return result
zip_code_geo_list = [
{
'type': 'Feature',
'geometry': {
'type': 'MultiPolygon',
'coordinates': [
[-88.252618, 32.92675],
[-88.249724, 32.93242],
[-88.34043199999999, 32.991199]
]
},
'properties': {
'ZCTA5CE10': '35442',
'AFFGEOID10': '8600000US35442',
'GEOID10': '35442',
'ALAND10': 610213891,
'AWATER10': 10838694
}
},
{
'type': 'Feature',
'geometry': {
'type': 'MultiPolygon',
'coordinates': [
[-88.252618, 32.92675],
[-88.249724, 32.93242],
[-88.34043199999999, 32.991199]
]
},
'properties': {
'ZCTA5CE10': '35442',
'AFFGEOID10': '8600000US35442',
'GEOID10': '15210',
'ALAND10': 610213891,
'AWATER10': 10838694
}
},
]
zips_of_interest = ['15210', '15222']
filter_zips(zip_code_geo_list, zips_of_interest)
filter_zips()
在这种情况下将返回删除了第一个字典而剩下的第二个字典的列表。