列表为a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger']
我正在尝试使用-
和/
替换列表中的项目(Pizza_Burger
,World_king
)。无论符号是什么,都应该用下划线代替。
这是我的代码:
import re
def replaceStrings(arg):
txt =arg
res = re.search(r'(?i)\b([a-z][a-z0-9_]*)([/-]+)([a-z][a-z0-9_]*)\b', txt)
if res:
pp = reg.sub(r'\1_\2',txt)
print(pp)
return pp
for i in a:
replaceStrings(i)
但我没有得到所需的输出。我的正则表达式有什么问题。 我是正则表达式的初学者。谢谢
答案 0 :(得分:5)
清理术语的一种简单方法是循环使用术语并分别清理每个术语。你可以去寻找像'World-king'.replace('/','_').replace('-','_')
或者您可以使用正则表达式进行清洁:
import re
def replaceStrings(arg):
# each individual special character you want to clean can be put in the brackets `[]`
pp = re.sub(r'[-/]', '_', arg)
print(pp)
return pp
a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger']
for i in a:
replaceStrings(i)
输出:
Aeroplane
Ramanujan
World_king
Pizza_Burger
更新:[由OP添加评论]
我采取了预防措施,确保我拥有所需模式的字符串。我的问题是,这是一种很好的做法我的方式 写了一个额外的步骤,而不是直接做re.sub?
如果您想在清洁之前确保图案匹配,也可以这样做:
import re
pattern = re.compile(r'(?i)\b([a-z][a-z0-9_]*)([/-]+)([a-z][a-z0-9_]*)\b')
def replaceStrings(arg):
if pattern.match(arg):
pp = re.sub(r'[-/]','_', arg)
print(pp)
return pp
a = ['Aeroplane','Ramanujan','World-king','Pizza/Burger']
for i in a:
replaceStrings(i)
输出:
World_king
Pizza_Burger