标签: python regex
我正在阅读Python中的每一行。如果它们包含句子的结尾,我必须将其拆分。我正在使用re.split功能:
words= re.split(r'[.!?]', line)
这很好用,除非遇到“ St.”之类的缩写。有没有办法用'。!?但是当它用作“ St.”时会忽略吗?
答案 0 :(得分:0)
您可以尝试使用负向后看:
words = re.split(r'(?<!St)[.!?]', line)
Demo