标签: python regex sentence
我一直在考虑这个问题很长一段时间,我无法按照我想要的方式工作。
现在,我有这个表达式尝试将一个文本块分成句子;
re.split(r"(\.(?<!mr)|\.(?<!mrs)|\?|!)+", somestring)
但无论我做什么,它总是将句号,惊叹号和问号作为列表中的项目以及单个句子返回。它并不区分正常时期和Mr.Mrs。或者,只是将它们切断,就好像它们也是句子的结尾一样。我的表情有什么问题?