R地理地址验证

时间:2015-04-17 13:33:37

标签: r google-maps geolocation

我正在尝试使用R中的ggmaps / mapdist函数计算地理位置(地址)之间的物理距离。除了谷歌地图只允许2500个查询/会话的令人不安的事实,我必须应对拼写错误或其他不完美的方式"地址&#34 ;.最典型的问题是确切的地址字符串本身是由几个其他信息(地板,门等)添加的,但是检测这些中允许应用正则表达式的任何模式都是非常有问题的。

我的目标是:

  1. 检查地图字符串是否可供Google地图识别;
  2. 如果没有,找到一种截断到可接受形式的方法,可能是从字符串中逐步解析单词。
  3. 有没有人应对这种问题?

    感谢。

1 个答案:

答案 0 :(得分:1)

这里有几个因素相互碰撞。一个因素是与地址相关的拼写错误和其他复杂性,另一个因素是精确定位(地理编码)给定地址。虽然它们是相关的问题,但每个问题都必须处理以实现您的目标。

有许多服务提供商可以以最低成本完成其中一项或两项。这可以通过简单的Google搜索找到。然后,您可以调查每个内容,看它们是否符合您的用例和许可要求。

考虑到所有这一切,您将希望至少清理您的地址列表。这样做可以使您使用任意数量的地理编码提供商。

根据列表的大小,您可以清理列表并进行地理编码,价格大约为20美元。

为了充分披露,我是SmartyStreets的创始人。我们提供了一个Web界面(以帮助清理地址列表)以及一个API(可以持续使用以保持地址清洁)。我们还对您的列表进行地理编码,无需额外费用。此外,我们对在给定时间范围内可以执行的查找次数没有任何许可限制。 (我们的客户每天都有数亿次访问我们。)注册和清理列表的整个过程只需几分钟。