我有一个非结构化邮政地址字符串和结构化邮政地址字符串列表。 我该怎么用来比较这些?
示例地址:
Unstructured: john appartments 7 koramangala bangalore india 560066
structured: 7, john appartments, koramangala, bangalore-560066, india
答案 0 :(得分:1)
如果您仅限于发现这些字符串相似的可能性,那么您需要查看此处提到的技术Finding groups of similar strings in a large set of strings
另一种方法 - 如果您可以访问地图/字典,那么您可以“构建”任何地址(通过查找国家/地区的名称,邮政编码,街道名称等),然后进行比较。
祝你好运