我必须像谷歌那样解析印度地址,我需要一些如何解析地址的例子。有没有地址解析的例子。是否有印度城市,地区,州,密码等免费词典
例如
5/802,vedvihar社会,靠近chandni chowk,浦那,411038
将解析为
建筑/街道= 5
house no = 802
当地/社会= vedvihar
地标= chandni chowk
城市普纳=
销= 411038
答案 0 :(得分:3)
所以这里有一些链接可能有助于解析邮政地址:
Parse usable Street Address, City, State, Zip from a string和 Java postal address parser
答案 1 :(得分:1)
您可以使用StringTokenizer(http://docs.oracle.com/javase/6/docs/api/java/util/StringTokenizer.html),您可以在此处找到教程: http://www.devdaily.com/blog/post/java/java-faq-stringtokenizer-example。
在示例中,字符串在空格边界上拆分,在您的情况下,您希望在行" "
中的","
替换StringTokenizer st = new StringTokenizer(tags," ");
。
确保aString.trim()
您的子字符串。
请告知您是否需要其他信息
答案 2 :(得分:1)
印度有哪些免费词典,地方, 状态,密码等
geonames.org有一个可下载的城镇数据库,包括邮政编码和行政区划。
答案 3 :(得分:0)
我不知道你的问题的背景所以也许这完全偏离主题,但这是我几个月前做的: 我使用谷歌地理编码API解决了非常复杂的自然语言处理部分。
API允许您发送全文地址并从中获取格式良好的XML,您可以轻松地提取街道,城市或您需要的任何信息。
也许这不是您要寻找的解决方案,但如果您可以使用Maps API,您将节省大量时间和精力:http://code.google.com/apis/maps/documentation/geocoding/
答案 4 :(得分:0)
如果您摆脱了html标签,就会有一个功能强大的开源库libpostal,非常适合此用例。有绑定到不同的编程语言。 Libpostal是一个C库,用于使用统计NLP和开放数据来解析/规范世界各地的街道地址。该项目的目标是在世界各地理解每种语言的基于位置的字符串。
对于Java,有jpostal
我用Python绑定pypostal创建了一个简单的Docker映像,您可以分拆并非常容易地尝试它pypostal-docker