我最近注册了Census API的开发人员密钥(http://www.census.gov/developers/),并将使用Python包装器类来访问Census数据库。
我还可以访问每日平均温度和数据的数据Feed。来自美国各地的100多个机场站的预报(这些站点主要代表美国人口,因为他们位于主要城市)。在最小的假设下,将整个美国人口映射到100多个机场的最佳方法是什么,以便我可以得出人口加权平均温度?这可能需要某种距离/气候功能。这样做时我应该考虑哪些细微差别?
答案 0 :(得分:0)
(1)听起来你需要类似于Voronoi tessellation的东西,但建立在邮政编码区域而不是连续空间上。基本上你需要将每个邮政编码区域分配给"最近的"机场,然后根据所有附近邮政编码的人口比例对机场的观察进行加权。 (我假设人口普查数据是按邮政编码组织的。)我说"最近的"在引号中,因为可能有不同的方式来考虑;例如到地区中心的距离,到地区人口中心的距离,从中心到机场的旅行时间,可能是其他地方。您可以使用强力算法将邮政编码分配给机场:只需循环浏览所有邮政编码,然后找到最近的机场和#34;在你选择的意义上。这可能很慢,但你只需要做一次(好吧,每次定义一次"最近的")。
(2)您可能会在CrossValidated上对此问题有更多关注。