我需要匹配一串字词,例如"Miguel Tiago"
,但不希望字符串包含数字。例如,我不想要"Miguel10 Tiago"
之类的字符串。此外,所有字符串都可能包含unicode。
我不能简单地做到:
re.match(ur'^[a-zA-Z ]+',string,re.UNICODE)
因为对于这种情况,具有诸如'ç'之类的unicode的单词将不被识别。
如何使用规则[\w ]+
并排除数字?
答案 0 :(得分:0)
我认为您正在寻找的解决方案是:(([^\W\d]+(?![\w\d])\s?)+)