例如,如果我有不同行的地址字段,如
(Ho. # 103 street # 65 Saat meel Kalar RAWALPINDI),
(h no. 732 St. No. 55 Mor gha RAWALPINDI),
(h# 611 St. # 57 old lalazar RAWALPINDI)
然后,我怎样才能使它像
一样独特(Ho. # 103 street # 65 Saat meel Kalar RAWALPINDI),
(Ho. # 732 Street # 55 Mor gha RAWALPINDI),
(Ho. # 611 Street # 57 old lalazar RAWALPINDI)
答案 0 :(得分:0)
看起来你并没有试图让它“独一无二”,但是,就像标题中的“一致”一样。
这很难做到。您需要做的是解析数据,允许不同类型的识别字符串。例如,对于住宅,您似乎想要接受"Ho. #"
,"h no."
和"h#"
。
一旦解析了数据,就可以以任何方式存储它(可能在数据库中)。然后你可以自由地输出你想要的任何格式(如你的上一个例子)。
没有任何内置功能可以为你神奇地做到这一点。
伪代码看起来像这样:
input = input.toLower()
house_ids = ['ho. #', 'h no.', 'h#']
p = start of string
While data left in string:
if string_at(p) is one of house_ids:
advance p
house_num = number_at(p)
// street, etc.