正则表达式unicode和口音

时间:2017-10-24 17:59:28

标签: python regex

为什么(^|\b)на́($|\b)віч на́ віч不匹配?

re.sub(r'(^|\b)на́($|\b)', 'на', 'віч на́ віч', flags=re.UNICODE)正在提供'віч на́ віч',而我需要віч на віч

1 个答案:

答案 0 :(得分:1)

使用s_componentid is distinct from cj.componentid

\W

输出:

import re
s = "віч на́ віч"
final_s = re.findall('\W+', s)[0]