正则表达式没有在python中返回预期的输出

时间:2017-02-24 13:36:48

标签: python regex regex-greedy

列表为a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger'] 我正在尝试使用-/替换列表中的项目(Pizza_BurgerWorld_king)。无论符号是什么,都应该用下划线代替。

这是我的代码:

import re
def replaceStrings(arg):
    txt =arg
    res = re.search(r'(?i)\b([a-z][a-z0-9_]*)([/-]+)([a-z][a-z0-9_]*)\b', txt)
    if res:
        pp = reg.sub(r'\1_\2',txt)
        print(pp)
        return pp



for i in a:
    replaceStrings(i)

但我没有得到所需的输出。我的正则表达式有什么问题。 我是正则表达式的初学者。谢谢

1 个答案:

答案 0 :(得分:5)

清理术语的一种简单方法是循环使用术语并分别清理每个术语。你可以去寻找像'World-king'.replace('/','_').replace('-','_')

这样简单的东西

或者您可以使用正则表达式进行清洁:

import re
def replaceStrings(arg):
    # each individual special character you want to clean can be put in the brackets `[]`
    pp = re.sub(r'[-/]', '_', arg)
    print(pp)
    return pp


a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger']
for i in a:
    replaceStrings(i)

输出:

Aeroplane
Ramanujan
World_king
Pizza_Burger

更新:[由OP添加评论]

  

我采取了预防措施,确保我拥有所需模式的字符串。我的问题是,这是一种很好的做法我的方式   写了一个额外的步骤,而不是直接做re.sub?

如果您想在清洁之前确保图案匹配,也可以这样做:

import re

pattern = re.compile(r'(?i)\b([a-z][a-z0-9_]*)([/-]+)([a-z][a-z0-9_]*)\b')

def replaceStrings(arg):
    if pattern.match(arg):
        pp = re.sub(r'[-/]','_', arg)
        print(pp)
        return pp

a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger']
for i in a:
    replaceStrings(i)

输出:

World_king
Pizza_Burger