假设我有4列名为"街道号码","街道名称","郊区"和"州",和三个明文句子:" 10魔术道路阳光VIC"," 105 calder street taylors lakes VIC"和" 3新道路airdale QLD"。
现在,我在各个部分之间添加了特殊字符,并在它们之间进行提取,但效率非常低。反正有没有对数据进行排序并为每列提取所需的位而不修改数据?
答案 0 :(得分:1)
不,没有。你需要人脑能力来识别这些词是否属于街道名称或郊区,如果他们不熟悉这些位置,甚至人类也可能需要帮助。没有任何逻辑可以应用,神奇地做出这种区分。
答案 1 :(得分:0)
您所描述的内容通常被称为"地址分解" - 公司为开发自动化此过程的算法获得了丰厚的回报,而这些算法通常需要不同地址部分之间的分隔符,并且主要基于官方地址产品 - 例如英国Postcode Address File (PAF)
然而,一个可能的选择 - 如果您没有太多地址,并且不经常需要执行此操作 - 可能是使用Google Geocoding Api。
您输入地址,输出为xml,带有合格的地址部分:Example
有很多方法可以使用它,但我非常喜欢将它与谷歌表ImportXML
function结合使用,如下所示: