我正在尝试使用R中的ggmaps / mapdist函数计算地理位置(地址)之间的物理距离。除了谷歌地图只允许2500个查询/会话的令人不安的事实,我必须应对拼写错误或其他不完美的方式"地址&#34 ;.最典型的问题是确切的地址字符串本身是由几个其他信息(地板,门等)添加的,但是检测这些中允许应用正则表达式的任何模式都是非常有问题的。
我的目标是:
有没有人应对这种问题?
感谢。
答案 0 :(得分:1)
这里有几个因素相互碰撞。一个因素是与地址相关的拼写错误和其他复杂性,另一个因素是精确定位(地理编码)给定地址。虽然它们是相关的问题,但每个问题都必须处理以实现您的目标。
有许多服务提供商可以以最低成本完成其中一项或两项。这可以通过简单的Google搜索找到。然后,您可以调查每个内容,看它们是否符合您的用例和许可要求。
考虑到所有这一切,您将希望至少清理您的地址列表。这样做可以使您使用任意数量的地理编码提供商。
根据列表的大小,您可以清理列表并进行地理编码,价格大约为20美元。
为了充分披露,我是SmartyStreets的创始人。我们提供了一个Web界面(以帮助清理地址列表)以及一个API(可以持续使用以保持地址清洁)。我们还对您的列表进行地理编码,无需额外费用。此外,我们对在给定时间范围内可以执行的查找次数没有任何许可限制。 (我们的客户每天都有数亿次访问我们。)注册和清理列表的整个过程只需几分钟。