使用正则表达式删除重复项

时间:2018-01-02 10:38:02

标签: python regex

您好我正在尝试从字符串中删除重复项。例如:

"Q. no. -320/2/2, Road no 25, Adityapur, Transport colony,  ADITYAPUR"

在上面的示例中,"Adityapur"重复两次。所以我想删除它。我怎么能用正则表达式做到这一点。

我正在使用这个正则表达式:

re.sub(r'\b(\w+)( \1\b)+', r'\1', s)

但它也删除了所有重复的字母。

1 个答案:

答案 0 :(得分:0)

正则表达式版本:

import re
s = "Q. no. -320/2/2, Road no 25, Adityapur, Transport colony,  ADITYAPUR"
s = s.lower()
re.split('; |, ',str)
m = [x.strip() for x in m]

sen = []
temp = []
for x in m:
    if x not in sen:
        sen.append(x)

free = ' '.join(sen)
print(free)