您需要删除/替换任何单个德语字符,例如ü
。
import re
re.sub(r'^\w{1}$', '', u'ü', re.U)
> u'\xfc'
以上代码不起作用,但如果:
re.U 下, 的 re.UNICODE 使\ w,\ W,\ b,\ B,\ d,\ D,\ s和\ S序列依赖于Unicode字符属性数据库。还可以为IGNORECASE启用非ASCII匹配。
答案 0 :(得分:1)
re.sub()
将flags
作为第5个参数,而不是第4个参数。第四是count
。这将有效:
>>> re.sub(r'^\w$', '', u'ü', flags=re.U)
u''