我有以下字符串:
txt="Daniel's car é à muito esperto"
我正在尝试删除所有引号。
我尝试过:
txt=re.sub(r"\u0022\u201C\u201D\u0027\u2019\u2018\u2019\u0060\u00B4\'\"", ' ', txt)
我期望:
"Daniel s car é à muito esperto"
但实际上什么也没发生。
答案 0 :(得分:1)
正则表达式不起作用的原因是它仅匹配单个字符串
r"\u0022\u201C\u201D\u0027\u2019\u2018\u2019\u0060\u00B4\'\""
要解决这一问题,可以在每个字符或字符集之间使用替换。
txt=re.sub(r"[\u0022\u201C\u201D\u0027\u2019\u2018\u2019\u0060\u00B4\'\"]", ' ', txt)
可能需要传递re.UNICODE
标志。未经测试。