你怎么让re.sub()理解unicode?

时间:2017-09-11 16:18:38

标签: python

您需要删除/替换任何单个德语字符,例如ü

import re
re.sub(r'^\w{1}$', '', u'ü', re.U)
> u'\xfc'

以上代码不起作用,但如果:

  

re.U 下,   的 re.UNICODE   使\ w,\ W,\ b,\ B,\ d,\ D,\ s和\ S序列依赖于Unicode字符属性数据库。还可以为IGNORECASE启用非ASCII匹配。

1 个答案:

答案 0 :(得分:1)

re.sub()flags作为第5个参数,而不是第4个参数。第四是count。这将有效:

>>> re.sub(r'^\w$', '', u'ü', flags=re.U)
u''