如何将变音符号与正则表达式匹配?

时间:2016-05-13 13:06:18

标签: python regex python-2.x

在德语文本中,变音符号(ä,ü,ö)和eszett(ß)是常规字母,但它们似乎不被\w特殊字符覆盖:

In [1]: re.match('(\w+)', 'Straße').groups()
Out[1]: ('Stra',)

re.UNICODE标记传递给re.match并不会改变任何内容。

有没有更好的方法来匹配除[a-zA-ZäüöÄÜÖß]+以外的完整单词?

1 个答案:

答案 0 :(得分:6)

由于您使用的是python 2,因此需要使用unicode字符串:

print re.match(ur'(\w+)',u'Straße',re.UNICODE).groups()[0]
Straße