我们的上游JSON API使用r'\ n'分隔段落,并为我们提供了一小段文本,例如:
“无论是好是坏,我们都由索马里人来决定我们的未来。”海湾酋长可能很快就会吸取这一教训。\ n詹姆斯·巴内特(James H. Barnett)是华盛顿特区的公共利益研究员。\ n我们是亚马逊服务有限责任公司合作伙伴计划的参与者,该计划是一项联盟广告计划,旨在通过链接到Amazon.com和联盟网站为我们提供一种赚取费用的方式。
当我使用Textblob.sentences解析它时,它会产生没有换行符的句子.string。但我想看看(并测试)。有人知道该怎么做吗?
仔细阅读文档,使我想到了nltk的Punkt标记生成器,该标记生成器似乎没有a straightforward way to retain the newlines,并且我现在还没有正则表达式来解决这个问题。救命?非常感谢!