python:删除各种引号

时间:2019-02-17 02:51:35

标签: regex quotation-marks

我有以下字符串:

txt="Daniel's car é à muito esperto"

我正在尝试删除所有引号。

我尝试过:

txt=re.sub(r"\u0022\u201C\u201D\u0027\u2019\u2018\u2019\u0060\u00B4\'\"", ' ', txt)

我期望:

"Daniel s car é à muito esperto"

但实际上什么也没发生。

1 个答案:

答案 0 :(得分:1)

正则表达式不起作用的原因是它仅匹配单个字符串

r"\u0022\u201C\u201D\u0027\u2019\u2018\u2019\u0060\u00B4\'\""

要解决这一问题,可以在每个字符或字符集之间使用替换。

txt=re.sub(r"[\u0022\u201C\u201D\u0027\u2019\u2018\u2019\u0060\u00B4\'\"]", ' ', txt)

可能需要传递re.UNICODE标志。未经测试。