地址解析

时间:2012-02-15 08:55:57

标签: java parsing

我必须像谷歌那样解析印度地址,我需要一些如何解析地址的例子。有没有地址解析的例子。是否有印度城市,地区,州,密码等免费词典

例如

  

5/802,vedvihar社会,靠近chandni chowk,浦那,411038

将解析为

  

建筑/街道= 5
  house no = 802
  当地/社会= vedvihar
  地标= chandni chowk
  城市普纳=
  销= 411038

5 个答案:

答案 0 :(得分:3)

所以这里有一些链接可能有助于解析邮政地址:

Parse usable Street Address, City, State, Zip from a stringJava postal address parser

答案 1 :(得分:1)

您可以使用StringTokenizer(http://docs.oracle.com/javase/6/docs/api/java/util/StringTokenizer.html),您可以在此处找到教程: http://www.devdaily.com/blog/post/java/java-faq-stringtokenizer-example

在示例中,字符串在空格边界上拆分,在您的情况下,您希望在行" "中的","替换StringTokenizer st = new StringTokenizer(tags," ");

确保aString.trim()您的子字符串。

请告知您是否需要其他信息

答案 2 :(得分:1)

  

印度有哪些免费词典,地方,   状态,密码等

geonames.org有一个可下载的城镇数据库,包括邮政编码和行政区划。

答案 3 :(得分:0)

我不知道你的问题的背景所以也许这完全偏离主题,但这是我几个月前做的: 我使用谷歌地理编码API解决了非常复杂的自然语言处理部分。

API允许您发送全文地址并从中获取格式良好的XML,您可以轻松地提取街道,城市或您需要的任何信息。

也许这不是您要寻找的解决方案,但如果您可以使用Maps API,您将节省大量时间和精力:http://code.google.com/apis/maps/documentation/geocoding/

答案 4 :(得分:0)

如果您摆脱了html标签,就会有一个功能强大的开源库libpostal,非常适合此用例。有绑定到不同的编程语言。 Libpostal是一个C库,用于使用统计NLP和开放数据来解析/规范世界各地的街道地址。该项目的目标是在世界各地理解每种语言的基于位置的字符串。

对于Java,有jpostal

我用Python绑定pypostal创建了一个简单的Docker映像,您可以分拆并非常容易地尝试它pypostal-docker