为什么(^|\b)на́($|\b)
与віч на́ віч
不匹配?
re.sub(r'(^|\b)на́($|\b)', 'на', 'віч на́ віч', flags=re.UNICODE)
正在提供'віч на́ віч'
,而我需要віч на віч
。
答案 0 :(得分:1)
使用s_componentid is distinct from cj.componentid
:
\W
输出:
import re
s = "віч на́ віч"
final_s = re.findall('\W+', s)[0]