正则表达式-按句点分隔(St.除外)

时间:2019-01-18 00:37:26

标签: python regex

我正在阅读Python中的每一行。如果它们包含句子的结尾,我必须将其拆分。我正在使用re.split功能:

words= re.split(r'[.!?]', line)

这很好用,除非遇到“ St.”之类的缩写。有没有办法用'。!?但是当它用作“ St.”时会忽略吗?

1 个答案:

答案 0 :(得分:0)

您可以尝试使用负向后看:

words = re.split(r'(?<!St)[.!?]', line)

Demo