Question

列表为a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger'] 我正在尝试使用-和/替换列表中的项目（Pizza_Burger，World_king）。无论符号是什么，都应该用下划线代替。

这是我的代码：

import re
def replaceStrings(arg):
    txt =arg
    res = re.search(r'(?i)\b([a-z][a-z0-9_]*)([/-]+)([a-z][a-z0-9_]*)\b', txt)
    if res:
        pp = reg.sub(r'\1_\2',txt)
        print(pp)
        return pp



for i in a:
    replaceStrings(i)

但我没有得到所需的输出。我的正则表达式有什么问题。我是正则表达式的初学者。谢谢

Answer 1

清理术语的一种简单方法是循环使用术语并分别清理每个术语。你可以去寻找像'World-king'.replace('/','_').replace('-','_')

这样简单的东西

或者您可以使用正则表达式进行清洁：

import re
def replaceStrings(arg):
    # each individual special character you want to clean can be put in the brackets `[]`
    pp = re.sub(r'[-/]', '_', arg)
    print(pp)
    return pp


a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger']
for i in a:
    replaceStrings(i)

输出：

Aeroplane
Ramanujan
World_king
Pizza_Burger

更新：[由OP添加评论]

我采取了预防措施，确保我拥有所需模式的字符串。我的问题是，这是一种很好的做法我的方式写了一个额外的步骤，而不是直接做re.sub？

如果您想在清洁之前确保图案匹配，也可以这样做：

import re

pattern = re.compile(r'(?i)\b([a-z][a-z0-9_]*)([/-]+)([a-z][a-z0-9_]*)\b')

def replaceStrings(arg):
    if pattern.match(arg):
        pp = re.sub(r'[-/]','_', arg)
        print(pp)
        return pp

a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger']
for i in a:
    replaceStrings(i)

输出：

World_king
Pizza_Burger

正则表达式没有在python中返回预期的输出

1 个答案: