Question

您好我正在尝试从字符串中删除重复项。例如：

"Q. no. -320/2/2, Road no 25, Adityapur, Transport colony,  ADITYAPUR"

在上面的示例中，"Adityapur"重复两次。所以我想删除它。我怎么能用正则表达式做到这一点。

我正在使用这个正则表达式：

re.sub(r'\b(\w+)( \1\b)+', r'\1', s)

但它也删除了所有重复的字母。

Answer 1

正则表达式版本：

import re
s = "Q. no. -320/2/2, Road no 25, Adityapur, Transport colony,  ADITYAPUR"
s = s.lower()
re.split('; |, ',str)
m = [x.strip() for x in m]

sen = []
temp = []
for x in m:
    if x not in sen:
        sen.append(x)

free = ' '.join(sen)
print(free)

使用正则表达式删除重复项

1 个答案: